KADOKAWA Technology Review
×
2024年を代表する若きイノベーターたちに会える!【11/20】は東京・日本橋のIU35 Japan Summitへ
アニメ絵に強いバイドゥの画像生成AI、中国ならではの弱み
Ms Tech | Getty, Envato
人工知能(AI) 無料会員限定
There’s no Tiananmen Square in the new Chinese image-making AI

アニメ絵に強いバイドゥの画像生成AI、中国ならではの弱み

バイドゥが開発したテキストから画像を生成するAI「ERNIE-ViLG」は、中国固有の文化に基づく物やアニメキャラ風の画像生成において、既存のAIよりも優れている。しかし、検閲機能によって、政治的にセンシティブな言葉は排除される。 by Zeyi Yang2022.09.26

テキストから画像を生成する新たな人工知能(AI)が登場した。中国のテック企業であるバイドゥが開発した画像生成AI「ERNIE-ViLG(アーニーViLG)」 は、中国特有の文化に根ざした画像を生成できるうえ、アニメ風キャラの画像生成においても、オープンAI(OpenAI)の「DALL-E 2(ダリー2)」をはじめとする欧米の画像生成AIを凌ぐ。

だが、中国第2の都市である北京にあり、政治の象徴的な中心地となっている天安門広場など、AIが画像を生成しない題材もたくさんある。

今年8月下旬にERNIE-ViLGのデモが公開されると、ユーザーたちはすぐに、特定の言葉が「センシティブ」とされ、画像が生成されないことに気づいた。政治指導者の名前が直接的に使われている言葉や、政治的な文脈でのみ話題になり得る言葉などだ。中国の高度なオンライン検閲システムは、どうやらAIの最新トレンドにも及んでいるようだ。

もっとも、特定のコンテンツを生成できないように制限している画像生成AIはめずしくない。DALL-E 2では、性的コンテンツ、公人の顔、医療行為の画像の生成は禁止されている。しかし、ERNIE-ViLGの場合は、モデレーションと政治的検閲の正確な境界線がどこにあるのかという問題を浮き彫りにしている。

ERNIE-ViLGのモデルは、バイドゥの自然言語処理の大規模プロジェクト「ウェン・シン(Wenxin)」の成果の一部を利用している。1億4500万組の画像とテキストのデータセットで訓練され、コンセプトやアートスタイルの微妙な違いを見分けるために、100億個のパラメーター(ニューラル・ネットワークが学習する際に調整する値)を組み込んでいる。ERNIE-ViLGの訓練用データセットは、DALL-E 2の6億5000万組や「ステーブル・フュージョン(Stable Diffusion)」の23億組よりも少ないが、パラメーターは両者よりも多い(DALL-E 2のパラメーターは35億、Stable Diffusionは8億9000万)。バイドゥは8月下旬に自社プラットフォームでデモ版を公開し、のちに国際的なAIコミュニティとして人気の高いハギング・フェイス(Hugging Face)で公開した。

ERNIE-ViLGと欧米のモデルの主な違いは、バイドゥが開発したモデルは中国語で書かれたプロンプトを理解し、文化的に特異な単語に関しては間違いが少ないということだ。

例えば、中国の映像クリエイターは、中国の歴史上の人物、ポップカルチャーの有名人、食品を含むプロンプトについて、さまざまなモデルが生成した画像を比較した。その結果、ERNIE-ViLGは、DALL-E 2やステーブル・ディフュージョンよりも正確な画像を生成するこ …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. How ChatGPT search paves the way for AI agents 脱チャットGPTへ、オープンAIが強化するプラットフォーム戦略
  2. Promotion NIHONBASHI SPACE WEEK 2024 アジア最大級の宇宙ビジネスイベント、東京・日本橋でまもなく開催
  3. Promotion Innovators Under 35 Japan Summit 2024 in Nihonbashi 2024年のイノベーターが集結「U35 Summit」参加者募集中
  4. This AI-generated Minecraft may represent the future of real-time video generation AIがリアルタイムで作り出す、驚きのマイクラ風生成動画
  5. The winners of Innovators under 35 Japan 2024 have been announced MITTRが選ぶ、 日本発U35イノベーター 2024年版
  6. Inside a fusion energy facility 2026年の稼働目指す、コモンウェルスの核融合施設へ行ってみた
▼Promotion イノベーター under35 2024
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者決定!授賞式を11/20に開催します。チケット販売中。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る