2024年11月11日月曜日

メタバースアプリの価格

Meta Questのアプリを見ていると、安いものでも900円辺り、多くのアプリは2千円台である。ゲームアプリなら安いと言えるのかもしれないが、PCやスマホでアプリを使ってきた感覚で言うと、かなり高い印象を受ける。しかも無料のアプリは殆どない。試用できるものも少ない。これでは気軽に試せない。

なぜこうなっているのかと考えてみると、大きくは2つの理由が考えられる。第一は開発コストが高いこと。第二は広告がないことだ。

第一の理由は、従来は画面設計で良かったところ、三次元でワールドを設計しなければならないところが高い理由の一つであると考えられる。多くのアプリはUnityなどのツールで作られていると思われるが、この開発環境は重く、従来のようにプログラミング言語ができるだけでは使い物にならない。絵やデザインのセンスが同時に求められるので、人材はより少なくなるだろう。これは仕方がない。時代が進んでツールが発達することに期待するしかない。

問題は第二の理由である。広告を表示させることで無料化を実現しているアプリは、スマホでは多く見かけられるが、これがメタバースでは全く見当たらないのである。

メタバース内でうまく広告を出す手段がない、あるいはそのためのAPIが整備されていない、というのがその実態なのだろう。確かに立体空間内に従来の広告を表示させるのは難しいだろうし、もし表示させてもそこだけ違和感が生じることは避けられない。スマホと違って画面全部を乗っ取ってしまうわけにはいかないし、中で人が動くのに広告が着いて回るのも変だ。広告を見せる、クリックさせる、クリックしたらどうなる、というメタファが、まだ完成していないのだろう。

Metaはこれを放置しているようにも見える。だがこれではアプリにいちいちカネを落とすことになり、普及を阻むことにもなる。ソーシャルワールド(Meta Horizon World)への誘導策なのかもしれないが、こちらの方にも有用な広告枠は見当たらない(広告はあるが、ただ見せるだけなので表示単価は低いだろう)。Metaは広告についてもっと真剣に考えるべきだと思う。

2024年11月8日金曜日

生成AIを使った教育システムの生成


 座学での教育について理想的なことを言うと、全てがコンピュータで帰結するようなものが想像できる。その概要は以下のようなものだ。

  1. あらかじめ体系は与えられていて、それは全人類共通である。あらゆる学問、趣味や雑学、宗教まで含め、同じEMS(Education Management System)からアクセスできる。但しそれは初期的なもので、個人の学習の進捗や学習コンテンツ自体の進歩によりダイナミックに変化していく。
  2. 学習者は、EMSにログインして、自分がどのような分野でどの程度の知識を持っているかを俯瞰的に把握できる。ここで成績は、学習済みコンテンツの数と、各コンテンツの理解度の相関係数である。
  3. EMSのリコメンドはあるが、基本的に学習者は自分の学習したいコンテンツを選んで学習を開始する。EMSのリコメンドは、前提知識と学習遷移(この学習をした人が次に学習したがる傾向)に拠るが、前提知識は生成AIが自動生成する。
  4. 学習コンテンツは基本的に映像である。再生スピードは0.25倍から4倍まで加速できる。また、学習コンテンツのボリューム目安は標準速で15分程度である。
  5. 映像再生中、学習者は任意の位置で一時停止し、音声ないしはチャットにより質問をすることができる。
    1. 質問に対する回答は、コンテンツから学習した生成AIが回答する。
    2. その回答に対し、学習者は追加で質問をすることができるし、回答に対する評価もすることができる。
    3. どこで質問が出たか、どのような回答をしたか、それがどう評価されたかは、後にコンテンツ制作者がコンテンツの改良の参考にすることができる。
  6. 映像終了後に確認度テストが必要なものは多いと思われるが、それも自動で生成され、また更新も自動でされるため、カンニングはしにくくなっている。
  7. 演習が必要なものも多いと思われる。コンテンツによるが、これも自動で生成されるのが望ましい。例えば発音などは定型でも良いだろうが、計算問題は都度変化させる方がよい。
  8. フィードバックをベースとして、学習コンテンツ(映像)自体も進化する。これも生成AIを利用する。ある程度賢くなったら更新は自動化する。その学習コンテンツも、関連する教科書や論文等を自分で探し、更新し続ける。
  9. ただ学習コンテンツを表示するだけでなく、学習者の表情や学習所要時間などを読み取って、得意不得意や飽きを検知し、適切な対処を行うAIを取り入れる。
  10. 忘却曲線や教育の偏りなど、ある程度分かっている既存の学識を取り込み、個人の学習指向を修正する機能がある。

システムのあちこちに、目的の異なるAIが多数絡んでいるのが特徴であり、極端な話、人間が具体的に作り込むものは無くても良い。逆に言えばAIの精度評価は重要であり、チューニングが狂うとウソを教えることになってしまうため、十分な注意が必要である。

このシステムが完成してしまうと、座学に関しては殆ど何もしなくても良くなる(アドバイスすら不要になる)ため、極端な話をすると教師は不要になる。座学以外でも、軽量のXRゴーグルが開発されれば実技(音楽、図工、体育、社会見学、HR、クラブ活動まで)がAI化出来てしまうため、学校すら不要になってしまう。(同級生は本物の同級生の所作を学習したAIアバターが演じれば良い)

まあそこまでの道のりは遠いのではあるが、実はコンテンツ自体はYoutubeなど世の中に溢れているので、EMS周りが出来てしまえば一気に進化する可能性は秘めているわけだ。そういう発想で研究をして頂けたらありがたい。

2024年11月7日木曜日

生成AIを前提とした開発言語

ChatGPTの勢いがスゴイ。類似のシステムでも、プログラミング言語を吐き出す機能が多数搭載されていて、興味深い。まだ精度は悪いようだが、これが進めば将来は明るいように思う。

さて、これらが吐き出す言語は既存のPython等だが、考えてみればこれは開発者が理解しやすいように作られたものだ。最初からAIを前提として開発する場合、既存言語にこだわる必要はない。ただ、人間が理解し修正できる必要はあるので、読みやすさは必要だ。逆に言えば書きやすさは必要ない。幾らでも自動でAIに書かせれば良いからだ。

となると、最も理解しやすいのは自然言語なのだから、自然言語で出力するというのが自然だろう。自然言語とプログラミング言語の大きな違いは厳密性の表記だが、ここをAIが調整してくれれば、自然言語でも厳密性を損なわずに記述できるようになるのではないか。

では入力は何かと言えば、プロンプトだ。つまりそれも自然言語である。となれば、AIの役割は「曖昧な表現を含む仕様書を、完璧な仕様書に直す」であると解釈される。

例えば、データベースから所望の情報を呼び出すためのSQLの1行を自然言語で書くとしたらどうなるか、と考えてみるとよい。「データベースXXから、XXとXXとXXを抽出する。その条件は、XXがTRUEであり、XXが500以上であり、・・・」と書いたとして、その日本語に複数の解釈が可能であるかどうかをチェックするのがAIの仕事、ということになる。これはまだプログラミング言語寄りなので、「XXを条件とするデータのXXを全てXXに上書きする」と描くだけでSQLが裏で生成されるのが好ましいということになる。更に言えば、「XXであるデータは常にXXであるべきである」と書くと、裏で勝手に情報修正をしてくれるのが望ましい。

つまり、アルゴリズム重視ではなく状態重視である。並列性はむしろ最大で良いだろうし、アルゴリズムがどうであっても最終的な計算結果が合っていれば良いのだ。その途中でACID特性などはAIが勝手に解釈して実行してくれる(べきだ)。

この(論理的に完璧な)日本語には、何らかの規格が付けられるのだろう。構造化日本語V2.0とか、そういうもので仕様書を記述する日は来るのかもしれない。

こうして出来た最終的な仕様書を基に、AIがマシン語に変換し、インストールし、実行してくれることになる。機能は良いとして、こうなると性能はAIコンパイラ(仮称)の良し悪しが効いてくる。前提とするマシンも、単体・クラウド・HPCなど色々あるし、予算に応じて制約が出ることもあるだろう。非機能要件が記述される可能性もある。その調整をAIでやるので、AIの賢さが信頼性やパフォーマンスに大きく影響を与える。各社の腕の見せ所ということになる。こういう競争なら歓迎のはずだ。

2024年11月6日水曜日

自動物流構想

自動運転ロボットが荷物を運ぶ、というサービスは、実証実験では多く登場しているが、本格的なサービスを開始したところはない。その理由は、今の道路や家の構造があまりにも多種多様なため、ロボットが行ける場所は限られているからだ。

これでは自動物流はいつまでも普及しない。ここはで発想を変えて、規定の規格に厳密に従える家(や事務所など)に限ってサービスを提供する代わり、格段に安くなる、という仕掛けを考えてはどうかと思う。

もちろんラスト1マイル、ラスト数十メートルのバリエーションはできるだけ用意するが、ある程度切り捨てることもする。例えば専用の宅配ボックスを置くことは必須とする。その宅配ボックスには電子錠が必須、但しそのための電源供給はロボットから可能。また公共道路からそこに辿り着くまでの段差を制限する。座標取得を容易にする900MHz帯RFIDマーカーを内蔵する。運べる荷物は50Lサイズ、20kgまで、とする。そして実際にサービス可能かどうかは、サービスプロバイダが審査する。荷物自体も専用の段ボールにする。サイズ固定、QRコード付きだ。

この片側が、Amazonのような通販業者や、倉庫業であるとすると、ある程度大きな建物であれば一様に得である。中規模マンション(数十世帯)なら宅配荷物など毎日届くだろうし、工場であれば何十何百と届くから、その省力化の効果は絶大だ。

問題になるのは、業者毎にその規格が違っていると目も当てられないということだが、そこは物流業界でしっかり話し合って、共通規格を作ってもらいたい。EUには既にそれらしき規格があるようなので、それを流用すれば済む。日本でもさっさと進めてほしいものだ。

2024年11月5日火曜日

電子カレンダー

シャープが出しているカラー電子ペーパーディスプレイがある。

https://smj.jp.sharp/bs/eposter/lineup/epc131.html

これは低消費電力で、書き換えが頻繁になければ電池で駆動できる。また、Bluetoothでスマホと接続し、書き換えができる。今回の提案は、これをベースに、特定機能のあるアプリを追加するだけのものだ。その機能とは、カレンダーだ。

まあ要するに、電子カレンダーである。通常のカレンダーと異なり、電子カレンダーのメリットは活かして表示は多少工夫する。以下、仕様案を提示する。

  1. 縦で使用する。
  2. 通常のカレンダーと異なり、先週、今週、来週、再来週…と並んでいる。つまり今週は常に2行目に来る。また今週の列だけは太く、表示面積が多くなっている。本日の枠は強調表示になる。
  3. 同じ表記内で月がまたがるため、月毎に背景の色が異なるようにする。
  4. Googleカレンダーのスケジュールが表示される。スケジュールが多い場合でも、字を縮小してあるいは行幅を増やして、全て表示される。
  5. 深夜0時に書き換わる他、スケジュールに変更があったら書き換わる。

たったこれだけである。これで10万円というとバカバカしく感じるかもしれないが、金持ち向けなら問題なかろう。他、

  1. 月曜始まりと日曜始まりが選択できる。
  2. 土用や六曜、星座等が好みで表示される。
  3. 上部に液晶式の電波時計が付けられる。
  4. Googleだけでなく他のスケジュールも反映できる。
  5. 上部に景色などの写真を表示する。あるいは背景として表示する。

などがあっても良いだろう。

通常のカレンダーに対するメリットは、もちろんオンラインのスケジュールを反映できる点である。スケジュールを登録しておけば、カレンダーがどこに何枚あろうとも自動で反映されるから、間違えることはない。

これは、例えば自分と家族のスケジュールをバラバラに管理しているときにも役に立つ。カレンダーを見れば、予定がバッティングしていることが分かるので、修正することができる。誕生日や記念日などを見逃す心配もないし、人によってはゴミ出しや推しのスケジュールなど、外部のオンラインスケジュールを取り込んでみることも出来るだろう。

2024年11月4日月曜日

インテリジェントフォトフレーム


卓上カレンダーのようなものを机に置いておいて、必要に応じてテレビ電話やフォトフレーム、緊急通報など、家で必要とされる様々な機能を集約する機械を考えてみる。

これは、従来は電話やFAXのような位置づけだったものだ。これら以外にも一家に一台の情報機器は考えられるので、それを切り替えて使えるようにするものだ。

こういうものと最短距離にあるのはタブレットだ。Google Pixel TabletAmazon Echo ShowLeChienTQタブレットなどに近いものと考えられる。だが前二者は汎用性が高すぎ、後者二者は機能が少なすぎる。またどちらにも不足している機能がある。

欲しいものは、以下のようなものだ。

  1. 充電台付きのタブレットであること。また、充電台から外してもスタンドが着いていて自立すること。バッテリ性能は6時間程度は欲しい。
  2. 普段はフォトフレーム、時計、カレンダー、天気予報、スケジューラが表示されている。
  3. インターホン室内機として使える。
  4. 緊急地震速報などの非常時通報の受信端末になる。
  5. ホームセキュリティのモニタになる。
  6. ホームオートメーションのモニタになる。
  7. 電話(インターネット電話だけで良い)、テレビ電話(ZoomやTeamsなど)が使える。

これだけ見ると、全部Google Pixel Tabletで出来る気がするだろう。だが、これらで大切なのは、「自由にカスタマイズできるから個人で工夫してくれ」ではなくて、「お仕着せのデフォルトを用意しています」である。まあ内部的にはプログラムを作れば良いだけなのだが、それは素人にも分かるように徹底的に優しくなくてはならない。

例えば、インターホンを専用のものと取り替えるだけで繋がるようにするとか、ホームセキュリティのセンサのQRコードを撮影するだけで接続するとか、スマホのアドレス帳から連絡先を転送できるとか、そういった細かい使い勝手にこだわるのである。そのデザインには一貫性を持たせ、人間工学や色彩などの知識を総動員して、使いやすさを追求する。

つまりはデフォルトの設計が命なのだ。ランチャーとウィジェットだけで済みそうにも見えるが、各アプリの操作性までを考えるとそうもいかない。アプリの開発元は揃え、UIも統一しなければならない。またOS汎用の操作は隠す必要がある。

例えば、大部分の操作は音声だけで完結できるようになってほしい。起動キーワードも機械のニックネーム(アレクサのような)をカスタマイズして設定できるようになっていてほしい。文脈は理解してほしい。表記の揺れも解釈してほしい。つまり固定キーワードをメニュー化するのではなく、生成AIがフロントに立ってほしい。その生成AIは各アプリを全て操作できるようになってほしい。

例えば「アラームを止めて」「ストップ」「うるさい」何れでもアラームを止めて欲しいし、「はい」「わかったよ」「OK」「良きに計らえ」何れでもYesと解釈してほしい。

どうもそこにこだわったアプリが出てこないのがモドカシイのだ。こういうことはAppleが得意ではないのだろうか。あまり期待せずに待っている。

2024年11月1日金曜日

Apple Vision Proの大き過ぎる弱点

 


欠点、と言いたかったのだが、あえて弱点と言わせてもらおう。

Apple Vision Proが出た時、Metaシンパは二番煎じだと笑い、Appleマニアは相変わらず無批判で褒め称えた。そして案の定、売れていない。

まあそうだろう。品質はいいらしいが、とても値段相応とは思わないし、値段の絶対値としても高すぎる。これは大方の評価だろう。

Apple Vision Proの角解像度は34PPDと推測されている。Meta Quest3は25PPDで、確かに解像度は良い。しかし視力1.0の角解像度は60PPDだそうだから、Appleでも全然足りていない。また視野角はApple Vision Proで90°、Meta Quest3で110°なので、こちらでは負けている。視野角を狭めれば角解像度は上げられるから、これは選択の問題であり、先の優位性も霞んでしまう。

だが、Apple Vision Proの最大の弱点は、そのコンセプトである「空間コンピューティング」である。これを掲げてしまったばっかりに、AppleはVRを捨てたと言っても過言ではなくなっている。

Meta Quest3で空間コンピューティングができないわけではない。Appleに比べて重視していないとは言えるが、それもApple Vision Proの登場で強化されつつあり、その差はほとんどない。一方でApple Vision Proはメタバースに入れない。入らないのではなく、入れない。

いいや、入れる、といいたいApple信者もいるだろうが、少し考えてほしいことがある。Apple Vision Proはそのコンセプトに基づき、コントローラを採用しなかった。これがメタバースには致命的なのだ。

Meta Questでは、メタバース内の移動にジョイスティックを使う。左が移動、右が向きを変えるのがデフォルトだ。これで空間内を自由に歩き回ることができる。一方Apple Vision Proはどうだろう。コントローラがないということはジョイスティックもないということだ。だから空間を動き回るのにジェスチャーで対応しなければならない。まあ不可能ではないが、きわめて使い勝手は悪く、ゲームなども含め使い物にはならないだろう。そして現に、Apple Vision Proのアプリには、その手の(メタバース内を縦横無尽に動き回る)アプリは全く見当たらない。業を煮やしたサードパーティがコントローラーを出したが、純正は未だに動きがない。

この手の動作が必要なのはアドベンチャーゲームだけだろう、と高をくくっていると足元をすくわれる。今後、メタバース内に街ができて、そこを歩き回って楽しんだり用事を進めたりする、つまり日常で実用でメタバースを使う時代は遠からず来る。今のネットスーパーのUIは醜悪だが、メタバース内の仮想スーパーで売り場を歩き回り、買い物カートを押しながら買っていくという形のほうが分かりやすいし、役所の何とか課のURLを探すよりは、受付に尋ねて、右手奥に見える③番窓口だ、と言ってもらうほうが自然だろう。こうなると、「歩く」という行為ができないのは極めて不利だ。

いやジャンプだジェスチャーだといくら言ったところで、使い勝手で圧倒的に劣るのでは意味がない。Apple Vision Proは、ゴーグル型デバイスの魅力の半分を捨てたとも言っても過言ではない。

遠い将来の理想を掲げるのも良いが、今の時点でコントローラを捨てる決断は早過ぎたのではないか。

注目の投稿:

メタバースアプリの価格

Meta Questのアプリを見ていると、安いものでも900円辺り、多くのアプリは2千円台である。ゲームアプリなら安いと言えるのかもしれないが、PCやスマホでアプリを使ってきた感覚で言うと、かなり高い印象を受ける。しかも無料のアプリは殆どない。試用できるものも少ない。これでは気軽...

人気の投稿: