ITアナリスト・小林啓倫=寄稿
拡大するお絵描きAIアプリ「AIピカソ」で「ロボットと一緒にリポートを作成するビジネスマン」を指定して生成させた画像=小林啓倫さん提供
今年7月、米国の通信社であるAP通信がOpenAI(オープンAI)社との提携を発表した。オープンAIといえば、話題の対話型AI「ChatGPT(チャットGPT)」の開発企業だ。チャットGPTは、指示した通りの文章を瞬時に生成してくれるAIであり、記事という文章を売り物にしている通信社とは敵対関係にあるようにも思える。いったい両社は、この提携で何をしようとしているのだろうか。
AP通信自らのプレスリリースによれば、彼らは「ニュース製品やサービスにおける生成AIの潜在的ユースケースを検討するため、ニュースコンテンツと技術へのアクセスを共有することで合意に達した」そうだ。
具体的には、「オープンAIはAP通信のテキストアーカイブの一部をライセンス供与され、AP通信はオープンAIの技術と製品に関する専門知識を活用することになる」としている。要するに、オープンAIはAP通信が蓄積してきた大量の記事データにアクセスでき、AP通信はオープンAIが持つAIに関する高度な技術力を利用できるようになる、ということだ。
プレスリリースでも解説されているように、AP通信社はこれまでも積極的にAI活用を進めてきたメディア企業のひとつである。「10年近く前からAI技術を活用し、定型的な作業を自動化することで、ジャーナリストをより有意義な報道に専念できるようにしてきた」「2014年に企業の決算報告の自動化を開始し、その後、一部のスポーツイベントについて記事を自動生成するようになった」としている。
ただし、生成AIで新しい記事をつくるという取り組みはまだ行っておらず、その使用基準について精査を行っている段階とのこと。いずれは基準が固められ、AP通信は何らかの形で、チャットGPTに代表される生成AIの活用に乗り出すだろう。オープンAIの技術力やAI活用ノウハウはその際に大きなアドバンテージになるはずだ。
オープンAIにとっても、この提携には大きな意味がある。
チャットGPTのような生成AIを開発する際、現在主流の開発手法では膨大なデータが必要になる。それをAIに「学習」させ、「同じようにふるまえ」と命じるためだ。これは「機械学習」と呼ばれる開発手法で、今後より効率的な手法が編み出される可能性はあるが、現時点ではとにかくデータ量がものをいう。
ところがいま、オープンAIはさまざまな訴訟に直面している。チャットGPTを開発するのに使用した大量データを、適切な形で集めていないのではないか、という懸念が持ち上がっているためだ。たとえば、6月には米国で「個人情報を違法に集めた」として利用者からの集団訴訟を受けている。また同月、モナ・アワドとポール・トレンブレイという作家が、自分の文書を勝手にAIの学習に使われたと提訴。同様の訴訟が7月にも発生している。
これらの訴訟がどのような結末になるかは分からないが、いずれにせよ、オープンAIが今後、自由に学習用のデータを集められなくなる可能性は高い。その際、AP通信などのメディアが所有する記事データへのアクセスを持つことが重要になるというわけだ。
では、AP通信がチャットGPTを使い始めたら、原稿執筆はどう変わるのだろうか。
チャットGPTは生成AIなので、執筆をすべて任せてしまうことも考えられるだろう。前述の通り、AP通信はすでに一部の原稿でAIを使用した自動生成に取り組んでいる。その延長線上にチャットGPTが位置付けられる公算は大きい。
とはいえ、現状では複雑な記事は不可能だ。現在、AP通信がAIに自動執筆させているのも、企業の決算報告やスポーツイベントの結果など、ある程度フォーマットが固まっている分野に限られる。
そうした領域では、自由度の高いチャットGPTのような生成AIよりも、「野球結果速報AI」のように特定の目的に特化したAIを開発する方が早いし、想定していない文章を書かれるリスクも小さい。むしろ生成AIがたけているのは、人間が執筆した既存の記事の加工だ。
実際の記事で検証してみよう。ここに、朝日新聞に掲載された「訓練中の宇宙飛行士候補は『つくば育ち』 市長、活躍を『全力応援』」という記事がある。朝日新聞デジタルで最近公開された記事、しかも茨城県つくば市のローカルニュースということで、チャットGPTにとってはまったく初めて見る記事であり、話題のはずだ。約600字の記事だが、すぐに内容が分かるよう「100文字以内で要約して」とチャットGPTに命じたところ、以下の文章が出力された。
《JAXAの新宇宙飛行士候補、諏訪理さんと米田あゆさんがつくば市長と懇談。厳選を経て選ばれ、筑波宇宙センターで基礎訓練中。市長は応援を誓い、2人はつくば市での生活と訓練に期待感を示した》
内容が理解できる要約が、92文字で生成された。それではこの要約を、「小学1年生にも分かるように」かみ砕いた文章にリライトしてもらおう。チャットGPTが出した結果はこうだ。
《JAXAから選ばれたおじさ…