カルチャー
2017年4月18日
人工知能は「星新一」になれるのか?
『人工知能解体新書』より
  • はてなブックマークに追加

形式的なニュース記事は人工知能がすでに書いている


 人工知能には文章が書けないのかといえば、もちろんそうではありません。すでに実用化が始まっています。

 AP通信は2014年より「ワードスミス」と呼ばれる人工知能がニュース記事を書いていることを公表しています。AP通信が配信する記事で、クレジットがAutomated Insights(会社名)となっている記事は人工知能が書いた記事です。

 2015年にはカレッジスポーツの記事を自動作成して提供するようになりました。実はスポーツ記事の開催や結果を伝えるニュース記事は定型のフォーマットにあてはまるものが多いのです。いつ、どこで、誰と誰とが対戦して結果はどうだったか、といった具合です。さらに、ゲーム前半はどちらがリードしたものの後半はどちらが優勢だった、もしくは逃げ切ったなどを付け加えれば体裁はできてしまいます。また、メジャーリーグ(野球)やプレミアリーグ(サッカー)、世紀の一戦などの記事は読者も詳細や人間模様も読みたいと感じますが、主に関係者だけが読んでいるだけのような記事は、結果が重要で、経過やくわしい状況はそれほど望まれていません。

 Automated Insights社のCEOは「100万のページビュー(PV)がある1本の記事ではなく、たったの1PVしかない100万本の記事をつくるのがわれわれの方針だ」というコメントをしています。

 そういったことを背景に、AP通信はNCAA(全米大学体育協会)からスポーツ情報の提供を受け、それをワードスミスがパターン解析し、自然言語生成処理をおこなって記事に仕上げ、実践での活躍がはじまっています。

 また、ワードスミスはテキスト文章だけでなく、Excelなどで作成された表やグラフ、数値の羅列も理解して、文章として起こすことができます。これを活かして、決算報告や表やグラフの解析文章にも利用されています。グラフや表をどのように読んだらいいのか、どんな傾向にあるのか、意味がつかみづらい場合にキャプションを文章で加えたり、アナリストレポートの原紙などを作成します。

 ワードスミスの解析機能は、いわばデータサイエンティストや医師等が論文や研究データを読み解くように、数値や表を人間が理解しやすく説明することができるようになることをめざしています。

 Automated Insights社のブレゼンテーション動画では、病院で健康診断の結果として数値やグラフのデータだけを渡されて戸惑う患者、会社で人事効果の測定結果のグラフを渡されて戸惑う社員、結婚を申し込んだ男性に対してグラフを指して結婚生活には心配があることを告げる女性などを例にあげ、データやグラフだけを渡されても理解できない、その資料の説明をすることを支援するツールとしても活用できるとしています(AP通信だけなく、サムスンや米Yahoo!、Microsoftなども導入しています)。

小説を書くことが難しい理由


 試合結果や決算サマリーの記事は書けても、小説はなぜ人工知能に書けないのでしょうか。もちろん「現段階では」という前置きが大切ですが、定型か定型ではないか、そして創作力がどれだけ必要かが大きなポイントです。

 現在注目されているディープラーニングなどの機械学習やニューラルネットワークでは、ビッグデータによってパターンを見つけだし、それをもとに分類したり、識別したり、判断する能力で人間に近づいたのです。試合結果や決算サマリーは元のデータがあり、それを形式やパターン(フォーマット)に合わせて作り直す(リビルドする)作業ですが、小説は主にゼロから発想して創作するものです。仮に元にする作家がいるとしても、その作家が作った文章をバラバラにしてリビルドしたところで、読者に感銘を与える小説になる可能性はほとんどゼロでしょう。

 人工知能に重要な要素のひとつに「報酬」があります。何を達成したら評価されるのかを与えなければ人工知能は自律学習できません。実は囲碁や将棋、ゲームには勝ち負け、優勢劣勢があり、報酬が明確なのです。そのため、人工知能の学習成果が出しやすい分野であるといえます。

自転車の例で言えば、転倒せずに1m走ることができれば高いスコア(=報酬)が与えられ、5m走ることができればもっと高いスコアが、10m移動できたらさらに高いスコアが得られるとする。このようにより長時間、転ばずにバランスをとって遠くまで行けるほど、高いスコアが与えられれば、コンピュータは高スコアを求めて実行を繰り返すことで、成功から学び、自律的に成功する方法を学ぶことになる


 小説には得点がなく評価も主観的なので、開発者・研究者が報酬を細かく設定する必要が本来はあります。

 また、別のアプローチの方が適切だろうと感じる部分もあります。人間が考えたストーリーをもとにリビルドしたのであれば、それは人間が作ったものです。しかし、ビッグデータの中から人工知能が発見したものは人工知能の成果です。仮に数百万の人間の会話の中から(コールセンターやオンラインショップの通話の音声データやログをビッグデータとして)、お互いが大笑いしている会話や一節を分析すると、今まで人間が気づかなかった笑いや、フレーズが見いだせるもしれません。

 それらを文章に紡ぐことによって生まれたショートショートは、人工知能が創作したものと呼べるのではないでしょうか。

(了)


人工知能解体新書
ゼロからわかる人工知能のしくみと活用
神崎 洋治 著



神崎洋治(こうざき ようじ)
ロボット、人工知能、パソコン、デジタルカメラ、撮影とレタッチ、スマートフォン等に詳しいテクニカルライター兼コンサルタント。1996年から3年間、アスキー特派員として米国シリコンバレーに住み、ベンチャー企業の取材を中心にパソコンとインターネット業界の最新情報をレポート。以降ジャーナリストとして日経BP社、アスキー、ITmediaなどで幅広く執筆。テレビや雑誌への出演も多数。最近はロボット関連の最新動向を追った書籍を執筆し、ロボット関連ITライターとして活躍中。主な著書に『図解入門 最新人工知能がよ~くわかる本』(秀和システム)、『Pepperの衝撃!』(日経BP)
  • はてなブックマークに追加