2019年3月8日金曜日

カメラ一つで


単に写真を撮るだけでなく、書類を撮影して補正の上スキャン画像のように平らにするソフトや、QRコードやバーコードを認識して読むソフト、概観からそれが何であるかを特定するソフトなどが出てきている。

他にも、パノラマ写真を自動合成する、部屋の間取りを3Dモデル化する、モーションキャプチャする、余計なものを消す、動きなどから人物を特定したり、怪しい動きを見つけるなども可能になっている。

今後も、カメラで対象を撮影するだけで色々なことができるソフトが増えてくるだろうが、そうすると困るのが、目的別にソフトがバラバラになってしまうことだ。

単純には、バーコードを読むときにはカメラソフトではなくバーコードリーダーソフトを立ち上げなければならない、ということなのだが、一つならまだしも、ソフトが何十と増えてきたら、まずそこで迷ってしまう。何でもカメラを向けておけばよい、という風にしてほしいのが本音なのだが、そこにはどんなことが必要なのだろう。

そこには、恐らくAIが絡んでくるのだろう。とにかくカメラボタンを一つ押して立ち上げ、映ったものを撮影する。するとAIが作動して、何が映っているかを概略で把握し、そこから先に何をするかを推定する。

例えばこんなインターフェースだ。スマホの横にボタンがあり、これを押すとカメラが起動する。画面はカメラ映像になり、通常の「静止画シャッター」「動画シャッター」「設定」のようなボタンの他に、映像の認識をリアルタイムにしつつ、その時に可能な操作のアイコンがどんどん現れる。

QRコードが映っていて、その内容がURLなら、リンク先に飛ぶためのボタン。商品が映っていたらAmazonへのリンク。建物が映っていたら概要や営業時間かどうか、混雑度などの表示。書類や写真なら画像処理して平らにし、整理した上で指定フォルダに落とすかどうか。交通標識なら意味と翻訳。友達の子供が写っていたら添付して転送するメールを自動生成。空が写っていたら天気予報。マンナビの途中なら案内方向の矢印。など等。

そういう意味では、カメラは今やユーザーインターフェースと言っても良い。画面のタッチと同じように、映像インターフェースのようなものを定義して、OSに積んでおくべきではないだろうか。

0 件のコメント:

コメントを投稿

注目の投稿:

ダイナミック租税とその指標

今の法律では、税率は一定の計算式で表されるが、そのパラメータは固定である。需要と供給のバランスによって商品の価格を変えるダイナミックプライシングというのがあるが、あれを租税にも適用してはどうかと考えてみた。 納税者の声をベースにして様々な租税や補助金を自動調節して、どこか一箇所...

人気の投稿: