2021年11月14日日曜日

カメラのみの自動運転とLIDAR+高精細MAP+カメラ+レーダーの自動運転についての雑感 (2021/11/24に追記)

 最近、テスラの自動運転(カメラのみ)とLIDAR諸々含む自動運転について素人ながら考えているのですが、以下雑感。

テスラのカメラのみ自動運転ですが、FSD(Full Self Driving) beta 9くらいまでは、結構慎重で、FSDがミスをしても人間が介入する余裕があったようですが、FSD beta 10くらいからはかなりアグレッシブな運転をするようになったようで、人間の介入が間に合わないミスをYoutube動画で散見するようになりました。実際NTHSAに、クラッシュの報告も出始めたようです。

個人的には、人間は視覚だけで運転しているので、機械もカメラだけで運転できるはずというのは確かにそうかもしれないとは思うのですが、今のところTeslaのFSDはうまくいってないようですね。実際、左前のすぐ前の対向車を認識してなかったり、すぐ前の信号機を交差点に進入してから認識するようなYoutube動画もありました(ともにFSD10.4)。


テスラは大量の画像データと人間の運転操作のデータを持っているので、他の自動運転よりも優位だという言説も見受けられるのですが、個人的にはこれには懐疑的です。


今のところTESLAのFSDのボトルネックは、周りのカメラによる認識が不十分であるように思えます。(工事の柵に突っ込もうとするFSD10.4の動画もありました)。

テスラのFSDは、人間の運転を一つの教師データとしているようですが、カメラと人間の視覚・認識にずれがある以上、あまり良い教師データとなるとは思えません。カメラの死角になったものを人間が見ていたかもしれませんし、逆の場合もあるでしょう。単純に人間の運転の上手下手にも差があるでしょう。

また、カメラAIがいくつかの基本的な画像認識が出来ていないなら(何もないのに急にブレーキがかかる、いわゆるゴーストブレーキや、特殊車両を認識できず追突する不具合等)、十分な学習が出来ていないのは明白で、AlphaGoのように、大量のサーバーと電力消費を車内で許容できるか、5Gの広い普及によるAIのクラウド化、あるいは何らかの画像認識アルゴリズムのブレークスルーができるならともかく、今の時点では、カメラAIはかなり難しい状況にあるのではないでしょうか。

一方で、LIDARと高精細MAPやカメラ等を用いた自動運転ですが、実は、こちらにはLIDARと高精細MAPという立派な教師データがあります。こちらの教師データを使ってカメラ認識の方の精度を上げるというやり方に関しては、テスラは他社に後れを取っているともいえるとは思います。テスラがLIDARをテスラの車両の上に取り付けてデータをとっていると思われる画像もSNS上で見られました。

コストがかかりすぎるのが欠点といわれるLIDAR等を用いた自動運転ですが、日々進歩しているようで、一方、FSD10がいまいちなテスラは若干焦り気味なのかもしれません。

カメラ自動運転になんらかのブレークスルーが起こるのを願ってはいますが、今のところそうはなっていないようです。

(2021/11/24に追記)FSD10.5に関しては、10.4よりも周りの認識が向上しているようです。まだ、いくつか運転上のミスが見られるようですが、10.2,10.3,10.4がかなり酷かったのでそれらよりも改善しているようです。ただ、運転手側もシステムの特徴をつかみ始めたのか、そもそも難しい苦手な道路を避けたり、難しい状況を避けるためにdisengagementしたりしてしまう動画もあって、いまいちどれくらいうまくいっているのかわからない部分もあります。

ただ、とても改善したという声がある一方で、全然変わらない、むしろ酷いみたいな声もちらほらあったり、そもそも、バグで表示がフリーズしてしまう人もいたようで、車両によっても何らかの差異があるのかもしれません。そちらもよくわからないところです。一部、カメラの光学フィルターのあるものへのアップデートを行っているという話も見かけたので、カメラの性能の差異もあるかもしれませんし、そもそもハードウェアの違いが何らかの違いを生んでいるのかもしれません。

あとは、もしかしたら地図データの情報に地域によって差異があるのかもしれません。