CateRina速報

ニュース・お金・仕事・経済にまつわる2ちゃんねるまとめ

最新ブログニュース

【緊急】 中国にすら抜かれた日本の人工知能研究 日本のヤバさを研究者が暴露 全文読むべし

   

1.名前: TEKKAMAKI(宮城県)@\(^o^)/
投稿日:2015/10/20(火) 22:05:11.81 ID:FRfEhD170●.net BE:601381941-PLT(13121) ポイント特典

sssp://img.2ch.sc/ico/anime_kuma01.gif
中国の人工知能研究が日本を一気に抜き去った理由
国立情報学研究所教授 新井紀子

コンピューターで人間の頭脳を代替する人工知能(AI)の研究競争が世界で 熾烈 さを増してきた。
中でも中国の伸長が著しく、AIで東京大学合格をめざす日本のプロジェクトを模倣した中国版
「難関大学突破プロジェクト」も始まった。産業応用を狙うと言い、技術交流を日本側に持ちかけてきた。
中国側の狙いはどこにあるのか。日本側のプロジェクト・ディレクターである新井紀子・国立情報学研究所(NII)教授に
寄稿してもらった。

http://www.yomiuri.co.jp/fukayomi/ichiran/20151016-OYT8T50057.html

■正直想定外だった中国の参入

1980年代初頭に茨城県つくば市を訪れたことがある。研究機関らしい巨大なビルが点在する広大な
空き地の上を、建設作業車が土埃を上げて雑草をなぎ倒して行く。あの頃のつくば市によく似ている。
それが私の中国・合肥の第一印象である。

私は2015年7月、合肥にある「iFLYTEK」(アイフライテック;科大迅飛)という新興IT企業で開催される
“中国版「ロボットは東大に入れるか」”のキックオフミーティングで基調講演を務めるため、改修されたばかりの
合肥駅に降り立った。

合肥へは上海から“中国版新幹線”で約3時間。今回通訳を務めてくれたiFLYTEKの系列企業の中国人社長は、
日本で起こった新幹線内焼身自殺事故のことに触れながら、「中国の新幹線は、日本の新幹線より速いし安全」と強調した。
ただし、合肥に到着したのは、予定より1時間半遅れの夜8時をだいぶ過ぎたころだった。

私が大学入試をベンチマークとした人工知能プロジェクト「ロボットは東大に入れるか」(通称:東ロボ)を
立ち上げたのは2011年の春のことである。当時、コンピューター将棋のプロジェクトはあったが、言葉を
理解し問題解決を図る人工知能の大型プロジェクトは、日本にはなかった。

続きます141231deep_learning-thumb-640x360-82636

2.名前: TEKKAMAKI(宮城県)@\(^o^)/
投稿日:2015/10/20(火) 22:05:41.18 ID:FRfEhD170.net BE:601381941-PLT(12121)

sssp://img.2ch.sc/ico/anime_kuma01.gif
人工知能が新聞の科学欄に取り上げられることさえ滅多になかったのである。当初、「国立情報学研究所は
ドラえもんを目指しているのか?」と冗談半分に語られることも多かったが、2013年に大手予備校の模試を
受験し、日本の大学の約半数に「合格可能性80%」と判定された頃から、だいぶ風向きが変わった。今や、
人工知能に関連する記事を新聞や雑誌に見ない日のほうが珍しい。

そんな折、iFLYTEKからのメールが届いた。そこには、中国でも難関大学を目指す人工知能の国家プロジェクト
(プロジェクト名称:高考機器人)を始める、ついてはキックオフミーティングで基調講演を行ってもらえないか、
と書かれていた。

中国が東ロボに関心を寄せている、という噂は聞いていた。だが、国家プロジェクトというのは初耳であるし、
その招待状が(大学ではなく)企業から届くというのも不思議なことである。国立情報学研究所では、事情に
詳しい中国人の教授や広報担当者を交えて真偽について確認した上で、担当者と面会することになった。

国立情報学研究所にやってきた担当者によれば、中国ではここ数年「東ロボ」に注目し、情報を収集してきたのだという。
そして、人工知能の主要な研究者を集めて、“中国版東ロボ”を国家プロジェクトとしてスタートしたのだと説明した。

国家プロジェクトと言っても国がすべての研究費を用意するのではない。中国では“863”と呼ばれる応用分野の
プロジェクトで、ビジネス展開を狙ってiFLYTEKと国が共同出資するそうだ。

私の気持ちには穏やかならざるものがあった。大学入試をターゲットとして選んだのは、紙の上での大学入試に
アメリカ国民がさほど関心をもっていないからであり、日本らしい人工知能研究が進められるのではないか、
と思ったからである。中国が参入してくるとは正直、想定外であった。

続きます

3.名前: TEKKAMAKI(宮城県)@\(^o^)/
投稿日:2015/10/20(火) 22:06:07.80 ID:FRfEhD170.net BE:601381941-PLT(12121)

sssp://img.2ch.sc/ico/anime_kuma01.gif
■人海戦術でビッグデータを磨き上げた中国

「東ロボ」がスタートした2011年は、ビッグデータ上の機械学習の威力を様々な形で私たちが目撃することに
なった年でもある。IBMのワトソンがクイズ番組「ジェパディ!」のチャンピオンを破ったのも、Googleの自動運転車が
ネバダ州で公道を走る許可を得たのもこの年である。2013年には日本で第2回電王戦が開催され、
コンピューター将棋がトッププロ棋士を破った。

こうして並べると、日本も人工知能で世界のトップを走っているという気がするが、実際はそうではない。
アメリカだけでなく、既に中国も日本の前を走っている。

技術の遅れが問題なのではない。機械学習の基礎となっているのは統計の理論である。統計だけで物事を
当てようとなれば、必要なのは何を差し置いてもデータである。データが集まらなければ、コンピューターが
どれほど早かろうが、並列計算の理論が発達しようが、いかんともしがたい。ところが、日本はビッグデータが
極めて集まりにくい国なのである。

Googleはゼロ年代から、電話番号問い合わせサービスを無料化する代わりに問い合わせの際の音声を
録音し、その十数年のデータの上で機械学習をすることにより、音声認識精度を向上させた。また、写真管理
サービスを提供していたPicasaを買収し、膨大な写真データを収集することで、人や物を識別し、分類する
精度を向上してきた。日本では想像がつかないようなサービスを世界に向けて無料で提供することにより
巨大なデータを集積する、という手法は、ベンチャーへの巨額投資の道筋がついているアメリカならではだといえる。

ヨーロッパはどうか。ヨーロッパの国々にはGoogleやAmazonのような企業はあまり見当たらない。
しかし、ヨーロッパは国際外交発生の地。ISO(国際標準化機構)など国際標準の基準作りや、最近では
「忘れられる権利」の検討など、制度設計に滅法強い。

では、中国ではどうか。政府の権限が極めて強い中国では、アメリカとは全く別の手法でビッグデータを集めることに成功している。

続きます

4.名前: TEKKAMAKI(宮城県)@\(^o^)/
投稿日:2015/10/20(火) 22:06:33.76 ID:FRfEhD170.net BE:601381941-PLT(12121)

sssp://img.2ch.sc/ico/anime_kuma01.gif
中国では、国家公務員や教員に採用されるためには、標準的な中国語を話せることが必要条件であり、
そのための試験がある。年間100万人以上が受験するとも言われる標準中国語のスピーキングテストの
音声データを集めることを中国政府は決定した。そのビッグデータを元に、標準的な中国語を話せるか否かを
判定するための音声認識器を開発したのが、iFLYTEKである。

このビッグデータを背景にiFLYTEKは音声認識精度を年々上げ、音声認識の世界的ベンチマークで1位を獲得。
今や中国のスマートフォンの7割にiFLYTEKの音声認識技術が搭載され、大学入試の英語スピーキングテストの
採点にも乗り出している。“中国版東ロボ”の狙いもこのあたりにありそうだ。

しかも、中国のビッグデータにはアメリカにはない優れた点がある。

データというのはただやみくもに集めるだけでは、どうしてもゴミが混じる。ゴミが混じれば、機械の精度は下がる。
機械は、有用なデータとゴミデータを見分けることができず、どちらも同じように学習してしまうからである。

どうするか。中国はなんと人海戦術を使って、悪いデータをピッキングして取り除くなどの前処理をすることによって、
一段と精度を上げたのである。いまや、人工知能の一級の国際会議にもっとも論文を通しているのはアメリカではない。
中国なのだ。

■ビッグデータが集まらない日本

さらに日本には不利なことが起こった。それは2012年に花開いた深層学習(ディープ・ラーニング)である。
深層学習も機械学習のひとつだが、従来の手法以上にデータ量を要求するのである。深層学習を使って
Googleが作ったシステムが、人間からの明示的な働きかけなしに猫が写っている写真を識別したことから、
「概念を獲得するコンピューターへの一歩ではないか」という人工知能研究者も日本では少なくない。

マーケット至上主義のアメリカ。そして、政府が号令をかければ好きなだけデータを集められ、人海戦術で
それをクリーニングできる中国。振り返れば、日本はスマートメーターの情報共有すら遅々として進まない
お寒い状況である。

続きます

5.名前: TEKKAMAKI(宮城県)@\(^o^)/
投稿日:2015/10/20(火) 22:07:09.83 ID:FRfEhD170.net BE:601381941-PLT(12121)

sssp://img.2ch.sc/ico/anime_kuma01.gif
アメリカと中国、そして老獪な外交官のように振る舞うヨーロッパに囲まれて、たった1億2千万人しか話さない
日本語を母語とする日本の研究者が、人工知能研究で何をし得るか。どうやってGDP(国内総生産)に
貢献できるのか。研究者であれば、誰もが同じことを悩んでいることだろう。

悩んだ末に私がひねり出したアイデアが、サイズは小さくてもゴミがない質の良いデータ、例えば教科書や
過去の試験問題から深く知識を読み取り、問題を解決する人工知能という枠組みだった。日本は世界でも
類を見ない丁寧な大学入試試験を実施している国である。アメリカのSATは同じ問題を繰り返し使うが、
日本では過去に出題された問題を再度使うことは決してない。

日本人は、それが当たり前だと思っているけれど、各大学が個別の筆記試験を課すような入試をしているのは、
先進国の中では日本だけなのである。過去20年のすべての日本の大学の入試問題とすべての教科書会社の
教科書を集めても、ビッグデータと呼べるようなデータ量には程遠い。でも、だからこそ日本の要素技術が光る
プロジェクトになり得るのではないか。そう考えてスタートしたのが「東ロボ」だった。

だが、「東ロボ」もいつまでも日本の専売特許というわけにはいかなかった。中国という巨大な競争相手が
出現したのである。考えてみれば、日本以上に大学入試熱が高いのだから、中国が大学入試をターゲットにした
人工知能に関心を持つのは当然のことである。

しかも、中国は3年間30億円という巨費を投じて研究をするという。対するこちらは、大学の運営費交付金が
年々減少する中では手厚く支援していただいているとはいえ、ケタがいくつか違う規模という身の上である。
日本が先にアイデアを出したのに、と思うと、もちろん悔しい。だが、研究上の競争はオープンでなければならない。
私は観念して合肥に向かった。

続きます

6.名前: ブラディサンデー(北海道)@\(^o^)/
投稿日:2015/10/20(火) 22:07:27.91 ID:OLD10AQa0.net

中国がそんなことできるかよw
韓国とともに平気で嘘を吐く国民性だぞ。

7.名前: TEKKAMAKI(宮城県)@\(^o^)/
投稿日:2015/10/20(火) 22:07:33.32 ID:FRfEhD170.net BE:601381941-PLT(12121)

sssp://img.2ch.sc/ico/anime_kuma01.gif
合肥では想像以上に温かく、尊敬をもって私を迎え入れてくれた。キックオフのミーティングも形式的なものではなく、
質疑が飛び交う建設的なものであった。驚いたことに、プロジェクト開始間もないのに、彼らは既にこの題材で
一級の国際会議に論文を通し始めていた。「東ロボ」もうかうかしてはいられない。競うべきところでは競っていくのは
当然だが、一方で、たとえば、ともに大学入試をターゲットとした人工知能に関する国際ワークショップを開催する、
といった連携は、東ロボのプレゼンスを高める上でも意義があるに違いない。

■日本の研究所で学んだ中国の研究者たち

最終日、私は中国科学技術大学の人工知能研究の中心である国家語音実験室を訪れた。iFLYTEKは
中国科技大発のベンチャー企業で、両者は現在も極めて密接な協力関係にある。聞くと、科技大の音声認識の
教授陣の多くがバブル時代に日本で博士号を取得したか、ポスドク時代を過ごしている。先生は誰かと尋ねると、
国立情報学研究所にゆかりの深い研究者の名前がぞろぞろ出てくる。

彼らは、科学技術大国日本の技術を持ち帰り、中国のビッグデータで成功したのである。ただし、その日
プレゼンしてくれた若手研究者2人のうち1人はイギリス、もう1人はアメリカで学んできたという。

深層学習で雑音処理の精度を飛躍的に向上させたという彼らにこんなことを尋ねてみた。「日本では今、
多くの人工知能研究者が深層学習に関心を寄せている。深層学習によってシンギュラリティ(技術的特異点=人工知能が
自らより高性能な人工知能を作り出せるようになる段階)がもたらされると考える研究者も少なくない。
深層学習は、機械に本質的な知能を持たせる上でどれくらい役に立つと思うか?」

すると、彼らは顔を見合わせてからこう言った。

「深層学習は、音声や画像などに関する分類問題には一定程度役に立つがそれ以上ではない。深層学習で
解決できるような問題は、もうだいたいわかったので、私たちは新しい問題を求めている」

私が日頃から考えていたのと、同じ答えであった。

日本は一歩遅れではなく、周回遅れになってしまっているのではないか。そんな不安を抑え込むようにして、
私は合肥を後にした。

8.名前: キングコングニードロップ(チベット自治区)@\(^o^)/
投稿日:2015/10/20(火) 22:07:58.99 ID:tLk3sPXJ0.net

東大なんて高望みせず、早稲田あたりから始めれば

9.名前: TEKKAMAKI(宮城県)@\(^o^)/
投稿日:2015/10/20(火) 22:07:59.26 ID:FRfEhD170.net BE:601381941-PLT(12121)

sssp://img.2ch.sc/ico/anime_kuma01.gif
終わりです
ソースは>>1

■新井紀子プロフィル

東京生まれ。一橋大学法学部卒。イリノイ大学数学科博士課程修了。理学博士。2005年より学校向け
情報共有基盤システムNetCommonsをオープンソースとして公開。全国の学校のホームページや
グループウェアとして活用されている。11年から人工知能分野のグランドチャレンジ「ロボットは東大に
入れるか」のプロジェクトディレクターを務める。ナイスステップな研究者、科学技術分野の文部科学大臣表彰などを受賞。
著書に「数学にときめく」(講談社ブルーバックス)、「コンピュータが仕事を奪う」(日本経済新聞出版社)、
「ロボットは東大に入れるか」(イースト・プレス)など多数。

10.名前: 急所攻撃(家)@\(^o^)/
投稿日:2015/10/20(火) 22:08:10.00 ID:/jWJbmdl0.net

地名が絶望的にくさい

11.名前: ツームストンパイルドライバー(大分県)@\(^o^)/sage
投稿日:2015/10/20(火) 22:08:28.69 ID:/X8mxezt0.net

寝言?

スポンサーリンク

12.名前: キン肉バスター(WiMAX)@\(^o^)/sage
投稿日:2015/10/20(火) 22:08:46.42 ID:xfi16GU30.net

長ぇよハゲ

学会に提出される数学系の論文の半分は中国人だしな データ取りにおいてもマンパワーが桁違いすぎる

13.名前: アルゼンチンバックブリーカー(新疆ウイグル自治区)@\(^o^)/
投稿日:2015/10/20(火) 22:08:51.26 ID:xBKeZyIY0.net

えーっと、スポンサーとか予算くれって話?

14.名前: メンマ(愛知県)@\(^o^)/
投稿日:2015/10/20(火) 22:10:36.84 ID:TdnJnX1N0.net

何も考えなくていいから黙ってコツコツ働けゴミ

15.名前: 不知火(チベット自治区)@\(^o^)/sage
投稿日:2015/10/20(火) 22:11:01.76 ID:VDz7veG00.net

先行者に抜かれるとは

16.名前: ショルダーアームブリーカー(三重県)@\(^o^)/
投稿日:2015/10/20(火) 22:11:42.30 ID:wHkzEngq0.net

長過ぎワロタw読まねえよ死ね!

17.名前: マシンガンチョップ(やわらか銀行)@\(^o^)/
投稿日:2015/10/20(火) 22:11:44.87 ID:thcIVPZU0.net

自己進化するAIの開発に成功した国が次の覇権だと思う

18.名前: スリーパーホールド(神奈川県)@\(^o^)/sage
投稿日:2015/10/20(火) 22:12:02.83 ID:kisRgKcf0.net

長い
3行でまとめろよ

19.名前: レインメーカー(庭)@\(^o^)/sage
投稿日:2015/10/20(火) 22:12:14.88 ID:s91NiVwv0.net

読んだ人いる?

20.名前: ファイヤーバードスプラッシュ(庭)@\(^o^)/sage
投稿日:2015/10/20(火) 22:12:27.16 ID:Wmmwwp0T0.net

続きます

21.名前: ニールキック(庭)@\(^o^)/
投稿日:2015/10/20(火) 22:12:33.68 ID:FHAtkCxq0.net

人工知能が話題になっているのは深層学習が注目されてるからでしょ
世界中で人工知能、人工知能って言ってるんだから
東ロボが模試で良い点を採ったのは関係ねーべ

22.名前: 雪崩式ブレーンバスター(家)@\(^o^)/
投稿日:2015/10/20(火) 22:12:40.06 ID:UT7uY4Q/0.net

当時はね、並列型コンピュータさえできれば勝てる!みたいな雰囲気だったんだよね

23.名前: パロスペシャル(庭)@\(^o^)/
投稿日:2015/10/20(火) 22:13:49.16 ID:oHShnN8A0.net

新井のりこか

24.名前: ファイヤーボールスプラッシュ(長野県)@\(^o^)/sage
投稿日:2015/10/20(火) 22:15:02.68 ID:jdh1lwnX0.net

ビックリするほど長いw

25.名前: リキラリアット(大阪府)@\(^o^)/
投稿日:2015/10/20(火) 22:15:32.50 ID:peoqZWQT0.net

まず その知能で 環境問題解決しろよ

26.名前: ランサルセ(愛知県)@\(^o^)/
投稿日:2015/10/20(火) 22:15:39.24 ID:ktPqWaH00.net

2進法の枠組みで 人間に類似した知性を創るなんて土台無理だろ
できるとしたら 推論とか記憶の分類整理に類似した DBがせいぜい
今人工知能とかいってんのは その検索精度を競っているだけだろ
ま それでもかなりムズいんだけどね

27.名前: シャイニングウィザード(dion軍)@\(^o^)/age
投稿日:2015/10/20(火) 22:15:40.72 ID:OBsLwcY50.net

張 来来

28.名前: 急所攻撃(dion軍)@\(^o^)/sage
投稿日:2015/10/20(火) 22:15:48.79 ID:L6CIicp70.net

さすがにこれぐらい読めなきゃ日本人じゃないだろw

29.名前: 32文ロケット砲(やわらか銀行)@\(^o^)/sage
投稿日:2015/10/20(火) 22:15:50.91 ID:c2PY9mQ50.net

えっ
ちょっとまって
Picasaの画像をGoogleが無断で使いまくってるって?

30.名前: グロリア(チベット自治区)@\(^o^)/
投稿日:2015/10/20(火) 22:15:58.72 ID:kyXwg+7y0.net

事情を知らない人間はそもそもニューラルネットの研究者なんか世界にほとんどいなかったことを知らないだろ。
この分野歴史も人数もないから専門家なんてそもそもいない。
金かければ人海戦術で追い抜くのはあたりまえ。日本は投資金額少ないからな

31.名前: 逆落とし(dion軍)@\(^o^)/
投稿日:2015/10/20(火) 22:16:15.46 ID:OOg62Asr0.net

文科省&財務省「よしもっと予算を減らそう」

32.名前: ニールキック(庭)@\(^o^)/
投稿日:2015/10/20(火) 22:16:23.47 ID:FHAtkCxq0.net

>>13
予算くれっていうのもあるだろうけど、人工知能を学習させるデータ欲しいってのがメインかな
アメリカはgoogleやamazonがデータ収集して人工知能に活用してるし、中国は政府の鶴の一声とマンパワーで大量のデータを得られる
日本はそういうのないどころか個人情報を利用するのも難しいので、そういうのをなんとかしなきゃ遅れちゃうねってこと

33.名前: ブラディサンデー(北海道)@\(^o^)/
投稿日:2015/10/20(火) 22:17:02.12 ID:OLD10AQa0.net

そもそもAIってなんなんだ?

34.名前: ストマッククロー(庭)@\(^o^)/
投稿日:2015/10/20(火) 22:17:09.99 ID:kpj/AVaT0.net

捏造人工知能じゃ測定もできんだろ

35.名前: クロイツラス(東日本)@\(^o^)/
投稿日:2015/10/20(火) 22:17:30.52 ID:ghLwpDGd0.net

>>32 われわれはデータを無料で提供してるってことか。

36.名前: バックドロップホールド(東日本)@\(^o^)/
投稿日:2015/10/20(火) 22:17:55.01 ID:ggv26BY20.net

それでも中国なら人工知能でも爆発してくれるはず

37.名前: マスク剥ぎ(大阪府)@\(^o^)/sage
投稿日:2015/10/20(火) 22:18:22.47 ID:nwu3t0WO0.net

おれ思うんだけどさ、コンピュータが人間の使う自然言語を理解するより、
人間とコンピュータが共通に理解できる新言語を作ったほうが早くね?

38.名前: ファイヤーボールスプラッシュ(やわらか銀行)@\(^o^)/sage
投稿日:2015/10/20(火) 22:18:41.88 ID:vHbEM2+m0.net

AIとか言うの初めて聞いたのドラクエ4だったかな
クリフトザラキばっかりで全然使えない物だと印象に残った

39.名前: キングコングニードロップ(catv?)@\(^o^)/sage
投稿日:2015/10/20(火) 22:19:18.61 ID:MH++iGh40.net

>>32
データを生成する人工知能を作れば良いだろ

CateRina速報

  • いいね  0
  • しらね  0
スポンサーリンク

投稿フォーム

いいね しらね

 - ニュース超速報

  関連記事

no image
鳩山元首相、中国主導AIIBの国際諮問委員に就任決定。信頼性を高める目的か
  • いいね  0
  • しらね  0

1.名前: ラダームーンサルト(長野県)@\(^o^)/投稿日:2016/07/ …

default_64380099169b8b4591ecdef2c9e54855
その声で叱ってほしい! と思う女性声優7選!
  • いいね  2
  • しらね  0

1.名前: ナガタロックII(東日本)@\(^o^)/投稿日:2016/03/1 …

紫BBA浜矩子が円安予想に転換!うああああああああああああああああああああああああ!!
  • いいね  1
  • しらね  0

1.名前: [Φ|(|´|Д|`|)|🌀] BBxed!! エク …