AIデジタルヒューマンが仕事を変える!? AI共存時代に生きるクリエイターの新しい役割

Vol.222
株式会社ニュウジア 代表取締役
Yukihiro Kashiwaguchi
柏⼝ 之宏

テレビをつければ、AIのアナウンサーやタレントが当たり前のように出演している——近未来のような話が、すでに現実となりはじめています。株式会社テレビ北海道は、株式会社ニュウジアが提供するAIデジタルヒューマン「Niuman AI」をアナウンサーとして起用。2023年11月18日に情報番組「スイッチン!」のお天気コーナーで地上波テレビ初放送(ニュウジア調べ)されました。

「AIは人間の仕事を奪うのではなく、仕事を補完して新たな価値をつくるものだ」と語るのは、ニュウジア代表取締役の柏⼝之宏さん。最新のAIデジタルヒューマンとはどういったものか、放送をはじめとするメディア業界、ひいてはクリエイティブ業界にどのような影響を与えるのか。柏⼝さんにじっくりと聞きました。

世界のAI開発競争で日本が立たされた位置とは

はじめに、ニュウジアが提供するAIデジタルヒューマンの特徴や強みを教えてください。

これまで、日本で一般的に見られるAIデジタルヒューマンの多くは、言葉遣いや表情にどこか不自然さが感じられ、一目で人工的なものだと判別できました。しかし、私たちが提供するAIデジタルヒューマン「Niuman AI」は、その精巧さにおいて人間と見間違うほどのリアルなビジュアルを実現しています。

加えて、AIデジタルヒューマンの「脳」にあたる最先端の大規模言語モデルを組み込んでいるのも特徴です。第三者機関による日本語ベンチマークスコアでは、89.04という高いアベレージスコアを記録し、これまで国内トップクラスといわれてきた日本語向け言語モデルを上回りました。この結果は、日本語を理解して話す国内のAIの中で、最も優れていることを証明しています。発話もいわゆる棒読みではなく、より人間らしい対話が可能です。

これにより、金融、法律、医療などのフォーマルな業種や、企業の顧客対応部門などでの活用にも対応できるようになりました。

ニュウジアが提供する「Niuman AI」のビジュアルの一例。さまざまなビジネス分野での活用が期待される

「Niuman AI」が高い精度を実現できるのはなぜでしょうか。

それは、海外の優れた最先端のAIテクノロジーを用いているからです。私たちは、中国やシンガポールなどで開発された世界最先端のAI技術を日本の文化に合うようにカスタマイズして提供しています。

AIの知性は主にデータの学習量に依存します。ディープラーニングという概念がありますが、これもデータ量が多ければ多いほど、AIは賢くなるという原則に基づいています。

囲碁や将棋のAIでは最初、人間が勝利していましたが、次第にAI同士の対戦が主流となり、数百万局の対戦を繰り返すうちに、人間が追いつけない領域へと進化を続けています。データ量がAIの賢さを決定するという好例ですね。

ビジネス分野では、かつてはコールセンターで人間が対応していた顧客の声に、今ではAIが自動的に応じるようになりました。中国では14億人の国民がいるため、1日あたりのトランザクション(※1)の量が膨大です。対して、日本の人口は約1億2000万人ですから、データの蓄積量に大きな差が生じます。

※1 データ処理や情報交換の一連の操作のこと。

人口の違いが学習量の差となり、技術の進歩にも影響するのですね。

それだけではありません。中国では、街中いたるところに監視カメラが設置され、顔認証技術を利用して14億人の顔を識別し、管理しています。このため、顔認証技術の分野でも、データ量において中国と日本の間には膨大な差があり、技術発展の速度に影響を与えています。
しかも、日本はAI分野への投資額が、アメリカや中国と比べて非常に小さい。当然ながら、世界中の優秀な頭脳は投資規模の大きい国に集まるため、結果として、論文の数も大きく異なる状況です。
海外の先進的なAIに対して、投資環境が劣る日本で独自のAIをゼロから開発しようとしても、残念ながら追いつくのは非常に難しいでしょう。しかも、この差はさらに顕著になると考えられます。したがって、AIを社会に役立てるためには、海外で実績のある技術を日本のローカルな環境に合わせて導入することが最も効果的だと、私たちは考えています。

労働や経営の負担軽減のほか、災害時の情報発信にも貢献

なぜAIデジタルヒューマンをアナウンサーとして活用しようと思われたのですか?

理由は主に2つです。まずアナウンサーは、日本語を話す職業として最も厳しい基準を持っていると考えたからです。正確な発音と表現を求められるアナウンサーへの採用は、高い技術レベルの証明になりますからね。
もう一つは、リアルタイム性の証明です。AIタレントが登場するCMなどの多くは、CGレンダリングという映像技術を用いており、数カ月の制作期間と膨大な予算が必要です。しかし、天気予報は時々刻々と変化する最新の気象情報を基に作成されます。AIデジタルヒューマンが天気予報を担当することで、リアルタイムで稼働していると明確に示せます。

AIデジタルヒューマンがアナウンサーとして起用された意義について、どのようにお考えでしょうか。

天気予報は、私たちの生活に欠かせない情報です。ただ、1日に何度も更新されるため、通常はアナウンサーが早朝から深夜まで勤務する必要があり、肉体的にも経営的にも大きな負担となっています。
さらに、地震などの災害が発生した際、放送局のアナウンサーが物理的に出勤できない場合がありますが、放送局の使命としては、避難の必要性など重要な情報を伝え続けることが求められます。AIデジタルヒューマンならば、24時間体制で天気予報を読むことができ、災害時も自動で情報を伝えられます。人間には困難な状況での情報提供に、大きく貢献できると考えています。
今回のプロジェクトは、第1フェーズとして実証実験の位置づけで、放送局のスタッフが書いた原稿をAIのシステムに読み込ませました。第2回目以降は、気象庁発表のデータをもとに、AIが自動的に原稿を生成し、発話して伝える予定です。スタジオやライティングなども必要とせず、すべて自動での運営を目指しています。

放送後の反響はいかがでしたか?

テレビ北海道による社内評価は、幸いにも非常に良好だったとのことです。私たちにとっても大きな成果となりました。ほかの地方局もこの取り組みに注目し、経営効率化や放送局としての使命を果たす手段として、デジタルヒューマンの採用を前向きに検討している様子がうかがえます。
地方局においては、今、経営効率化によってもたらされる効果がとくに大きな意味を持ちはじめています。この動きは、今後さらに広がる可能性があり、放送業界の未来に大きな影響を与えると考えています。

映像分野ではすでに「不気味の谷」を克服した

人間らしさを表現するうえで、気をつけた点や大切にしたことを教えてください。

アナウンサーですから、やはりクリアで聞き取りやすい流暢な話し方を重視しました。ロボットのような単調な話し方にならないようにすることが、主な目標の一つでしたね。
今後は、人間らしい感情表現にどこまで迫れるかが課題です。朗読劇やオーディオブックなどで実際の俳優が行う感情を込めた読み方は、AIにとってはまだ難しいのが実情です。怒りなどの特定の感情表現はAIにも可能ですが、文脈を理解したうえでのより複雑な感情の表現には、まだ改善の余地があります。

この分野では、しばしば「不気味の谷現象(※2)」の克服が課題とされますが、どういった取り組みをされましたか?

「不気味の谷」については確かに、昔から多くの議論がありましたが、これは物理的なマネキンやロボットに関連する問題が主だったと思います。例えば、義眼や人工皮膚などのリアリズムを高める研究や議論といったものですね。一方で、私たちの取り組みは映像世界に焦点を当てています。映像の分野でいえば「不気味の谷」は克服したと考えています。
人間のモデルをAIデジタルヒューマン化する際、例えば口を動かす表現では、口が動くだけでなく、目や体全体の動きまでも連動してリアルに再現する技術が進んでいます。過去に、プリントシール機や美顔機能を備えたカメラアプリなどで培われた技術が、さらに進化してAIデジタルヒューマンにも応用され、全体的なリアリズムを高めるのに大きく貢献しました。映像における「不気味の谷」の問題は、こうした総合的な美化技術の応用によって、大きく克服されています。

※2 ロボットや映像キャラクターにおいて、人間に近いが完全には似ていないときに、人々が不快感や恐怖を感じる現象。

AIは仕事を拡張して新たな形の収入を生み出すもの

AIデジタルヒューマンが放送業界に普及していくと、「仕事を奪われる」と不安に思う人もいるのではないでしょうか?

AIデジタルヒューマンは「人間の仕事を補完するもの」です。タレントやアナウンサーの仕事を奪うのではなく、仕事を拡張し、新たな形の収入を生み出すものだと考えています。
例えば、タレント本人が物理的に出演できない夜中などの時間帯でも、デジタルヒューマンが代わりに仕事を行い、その対価の一部をタレントが受け取ることができます。タレントは肉体的な負担を軽減しつつ、収入を増やせるかもしれません。
さらに、AIによって英語やフランス語など複数の言語での表現が可能になり、活動を世界に広げることも容易になるでしょう。つまり、AIが既存の仕事の枠組みを拡張して、新しい形の働き方を提供するというわけです。

人間がAIをうまく活用して、新しい価値を生み出すべきなのですね。

そもそもAIと人間が競うという構図は適切ではなく、むしろAIを活用して人間が特化する領域を見つけることが大切だと思っています。
過去のイノベーションも同じで、例えば、パワーショベルの発明により、人力での掘削作業は不要になりましたが、代わりにパワーショベルのオペレーターという新しい職業が生まれました。一方で、ウェイトリフティングのような競技では、パワーショベルと競うこと自体がナンセンスです。競技の目的は、単に重い物を持ち上げることではなく、人間の能力と技術の追求にあるからです。
このように、AIは人間の仕事を奪うのではなく、新しい機会を提供し、人間がもっと特化して楽しめる生活をつくり出す道具となりえるものです。

「AIが人間の仕事を補完する」という観点から考えると、今後のクリエイターが意識すべきことは何でしょうか。

AIの能力は、細かい分析や知識の整理において人間を凌駕する可能性がありますが、人間特有の感情や共感を提供する能力はまだAIにありません。
例えば、医療分野では、AIはレントゲンの画像分析や細胞レベルでの病巣の特定に優れている一方で、患者に対する共感や心理的サポートを提供する役割は、依然として医師や看護師が担っています。同様に、法律分野では法律知識の分析やアウトプットはAIが優れていますが、裁判における被告へのいたわりや心理的サポートは弁護士の重要な役割です。
クリエイティブな分野に目を向ければ、今はデジタル技術の進化で音楽制作の方法が変わり、楽器を弾かなくても音楽がつくれるようになりました。しかし、アコースティック楽器の演奏など、人間ならではの感覚や表現は、AIでは実現できない魅力があります。
AIを活用しながらも、人間は特有の感性や共感、創造力を活かした分野で新しい価値を生み出すことが可能です。クリエイターの世界にもますますAIが普及し、新しいクリエイションの領域が生まれることは間違いありませんが、人間の良さを生かす領域にこそ、今後のクリエイターの展望が広がっているのではないかと思います。

取材日:2023年12月11日 ライター・撮影:小泉真治

株式会社ニュウジア

  • 代表者名:柏口 之宏
  • 設立年月:2008年12月
  • 資本金:94,500,000万円
  • 事業内容:AI技術の研究開発、コンサルティング、映像制作、AIソリューション販売、AIデジタルヒューマン販売
  • 所在地:〒104-0061 東京都中央区銀座一丁目27番8号 セントラルビル703号
  • URL:https://www.niusia.net/
プロフィール
株式会社ニュウジア 代表取締役
柏⼝ 之宏
1991年4月、株式会社セガ・エンタープライゼスに入社。その後、2004年4月にネットワーク戦略事業部アジアオンラインビジネス部の部長兼参事として活躍。同年、セガ・チャイナの設立にも関わり、董事兼総経理(CEO)を務めた。2006年12月に株式会社セガを退社後、2007年1月にACCESS BRIGHT LIMITEDを設立。2008年12月には株式会社ニュウジアを設立、その経営を牽引している。2019年2月、日経ビジネス「世界を動かす日本人50」に選出。

日本中のクリエイターを応援するメディアクリエイターズステーションをフォロー!

TOP