2019年3月8日金曜日

カメラ一つで


単に写真を撮るだけでなく、書類を撮影して補正の上スキャン画像のように平らにするソフトや、QRコードやバーコードを認識して読むソフト、概観からそれが何であるかを特定するソフトなどが出てきている。

他にも、パノラマ写真を自動合成する、部屋の間取りを3Dモデル化する、モーションキャプチャする、余計なものを消す、動きなどから人物を特定したり、怪しい動きを見つけるなども可能になっている。

今後も、カメラで対象を撮影するだけで色々なことができるソフトが増えてくるだろうが、そうすると困るのが、目的別にソフトがバラバラになってしまうことだ。

単純には、バーコードを読むときにはカメラソフトではなくバーコードリーダーソフトを立ち上げなければならない、ということなのだが、一つならまだしも、ソフトが何十と増えてきたら、まずそこで迷ってしまう。何でもカメラを向けておけばよい、という風にしてほしいのが本音なのだが、そこにはどんなことが必要なのだろう。

そこには、恐らくAIが絡んでくるのだろう。とにかくカメラボタンを一つ押して立ち上げ、映ったものを撮影する。するとAIが作動して、何が映っているかを概略で把握し、そこから先に何をするかを推定する。

例えばこんなインターフェースだ。スマホの横にボタンがあり、これを押すとカメラが起動する。画面はカメラ映像になり、通常の「静止画シャッター」「動画シャッター」「設定」のようなボタンの他に、映像の認識をリアルタイムにしつつ、その時に可能な操作のアイコンがどんどん現れる。

QRコードが映っていて、その内容がURLなら、リンク先に飛ぶためのボタン。商品が映っていたらAmazonへのリンク。建物が映っていたら概要や営業時間かどうか、混雑度などの表示。書類や写真なら画像処理して平らにし、整理した上で指定フォルダに落とすかどうか。交通標識なら意味と翻訳。友達の子供が写っていたら添付して転送するメールを自動生成。空が写っていたら天気予報。マンナビの途中なら案内方向の矢印。など等。

そういう意味では、カメラは今やユーザーインターフェースと言っても良い。画面のタッチと同じように、映像インターフェースのようなものを定義して、OSに積んでおくべきではないだろうか。

0 件のコメント:

コメントを投稿

注目の投稿:

超音波モーターの原理によるVR用トレッドミル

  VRにおけるリアリティ問題の一つに、その場で動くのではなく移動する場合、つまり歩いたり走ったりすることが挙げられる。実際にはその場にいるので、歩いたかのように足場を調節してやる必要がある。 これを実現する方法として、すり鉢状の滑りやすい足場を作っておく方法と、トレッドミルを使...

人気の投稿: