KADOKAWA Technology Review
×
12/16開催 「再考ゲーミフィケーション」イベント参加受付中!
AIが書いた文章をほぼ確実に見破る「電子透かし」技術
GETTY IMAGES
人工知能(AI) Insider Online限定
A watermark for chatbots can spot text written by an AI

AIが書いた文章をほぼ確実に見破る「電子透かし」技術

メリーランド大学の研究チームは、AIが書いた文章を見分ける「電子透かしアルゴリズム」を開発し、オープンソース言語モデルに実装して有効性を確認した。盗作の検出やネット上のボット対策に利用できるかもしれない。 by Melissa Heikkilä2023.02.07

人工知能(AI)が生成したテキストに埋め込まれた隠されたパターンが、そのテキストがAIによって書かれたかどうかを見分けるのに役立つかもしれない。自分が読んでいる文章が果たして人間によって書かれたものなのかどうかを判断できるようになるのだ。

この「電子透かし」は、人間の目には見えないが、コンピューターに読み込ませることで、その文章がAIシステムの生成物である可能性を検出できる。大規模言語モデルに電子透かしが組み込まれれば、言語モデルがすでに引き起こしている問題を防げる可能性がある。

例えば、オープンAI(OpenAI)のチャットボット「チャットGPT(ChatGPT)」は2022年11月に公開されて以来、すでに学生らによって小論文の代筆に悪用されている。ニュースサイト「CNET」はAIを記事の執筆に使用したものの、盗作の非難を受けたあげく、訂正記事を出す羽目になった。しかし、AIが生成した文章を見破る有望な方法がある。そうした文章を識別できるような隠されたパターンを、リリース前のAIシステムに埋め込んでおくことだ。

すでにいくつかの研究で、こうした電子透かしを目印として、AIが生成した文章をほぼ確実に識別できることが示されている。メリーランド大学の研究チームが開発した電子透かしは、彼らが構築した検出アルゴリズムにかけることで、メタのオープンソース言語モデル「OPT-6.7B」が作成した文章を判別できた。この研究成果は、まだ査読を受けていない論文に記載されており、2023年2月15日頃にコードが無償公開される予定だ。

AI言語モデルは作動中、一度につき一つの単語を予測・生成する。メリーランド大学の研究チームの電子透かしアルゴリズムは、それぞれの単語に続く言語モデルの語彙を「グリーンリスト」と「レッドリスト」にランダムに分類し、グリーンリストにある単語を選択するよう言語 …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. Who’s to blame for climate change? It’s surprisingly complicated. CO2排出「責任論」、単一指標では語れない複雑な現実
  2. Promotion MITTR Emerging Technology Nite #31 MITTR主催「再考ゲーミフィケーション」開催のご案内
  3. Who’s to blame for climate change? It’s surprisingly complicated. CO2排出「責任論」、単一指標では語れない複雑な現実
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者決定!授賞式を11/20に開催します。チケット販売中。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る