banner
ニュース センター
卓越した顧客サービス

AI:精度を向上させるにはより多くのウェールズデータが必要、と企業が語る

Jul 20, 2023

技術開発者らは、ウェールズで人工知能(AI)が確実に機能するためには、ウェールズでのより良い協力が必要だと述べている。

チャットボット ChatGPT のウェールズ語の理解とコミュニケーション能力は研究者に感銘を与え、この言語は「AI 革命の一部」であると言う人もいます。

しかし彼らは、著作権で保護されているウェールズ語の教材をコンピュータソフトウェアの訓練に利用できるようにする必要があると述べた。

ウェールズ政府は、戦略を間もなく更新すると述べた。

すでに人工知能を利用してバイリンガル サービスを提供している企業の 1 つが、アングルシー島に拠点を置く Haia です。

このオンライン イベント会社は、同時翻訳ソフトウェアを使用して、講演者が翻訳された字幕付きでウェールズ語または英語で話すことを可能にしています。

しかし、その共同創設者であるトム・バーク氏は、より多くのウェールズ語データが合法的に利用可能であれば、製品は改善される可能性があると述べた。

「私たちが抱えている問題の1つは、それがどれほど正確であるかということです。ドイツ語やスペイン語と比較すると、ウェールズ語は小さなデータセットです」とバーク氏は述べた。

「翻訳や転写に不正確な点があることがよくあります。それを改善する方法は、実際にウェールズ語で利用できる豊富なデータにアクセスすることです。」

言語 AI テクノロジーは、コンピューター化された大規模な言語モデルと連携し、ウェブページ、書籍、記事などの膨大な量のデータを使用して、どの単語やフレーズが組み合わされるかを予測します。

ウェールズ語データには、ラジオ番組やテレビ番組も含まれる可能性があります。

「そのデータを入手できれば、それを使ってモデルを訓練すれば、ウェールズ語モデルはより正確になるでしょう」とバーク氏は付け加えた。

「これにより、私たちはそのテクノロジーに関して有利なスタートを切ることができ、世界中の他の小規模な使用言語に目を向けることができ、ここウェールズで学んだ教訓を活用して、それらの市場でもテクノロジーを推進することができます。

「長期的には、これにより新しい企業が設立され、新たなイノベーションが可能になり、ウェールズは言語技術の中心地となる可能性があります。」

バンゴー大学キャノルファン・ベッドウィルの研究者は、8年前にウェールズ語チャットボットのプロトタイプであるMacsenを立ち上げた。

現在、米国の OpenAI が開発した ChatGPT を使用して実行しています。

経済的な可能性だけでなく、キャノルファン・ベドウィル社の言語技術ユニットの責任者であるグリフィズ・プライス氏は、技術を「ウェールズ語とウェールズ全体のニーズにより適したものにするために、ウェールズ語教材を利用できるようにする必要がある」と述べた。 」。

同氏は、「人工知能の品質を向上させるために私たちができることの一つは、モデルがウェールズの現実を反映し、過度にアメリカ的であったり、アメリカ的であったりしないように、そこにあるデータを寛容なライセンスの下で利用できるようにすることだ」と語った。インターナショナルモデル。」

トム・バーク氏は、データへのアクセスを早急に実現する必要があると述べた。

「われわれはすでに12カ月のイノベーションの時間を失っており、最終的にはわれわれが時代遅れになるだけで、われわれがそれを利用し始める時点で、世界の残りの国々はすでにそれを手に入れていることになるだろう」と同氏は語った。

「我々はこの素晴らしい地位を築いており、このバイリンガルの国を持っています。

「バンゴーのような素晴らしい大学がこの技術に取り組んでいます。企業がこの技術を使い始めて市場に参入できるように、今すぐ取り組む必要があります。」

ウェールズ語を担当するウェールズ政府大臣ジェレミー・マイルズMS氏は、AIを利用してウェールズ語を開発することは「非常に重要」だと述べた。

「これは当社のウェールズ・イン・テクノロジー戦略における重要な優先事項であり、次期に向けて更新する予定です」とマイルズ氏は語った。

「我々はこれに200万ポンドを費やしており、これは我々の次の戦略にとって非常に重要な優先事項であることに変わりはないので、その時にはこれらすべての質問を考慮に入れることができるだろう。

「技術開発においては、ウェールズ語だけでなく他の言語でも利用できるようにすることが非常に重要です。」

芸術家の作品はピカソよりも多くAIによってコピーされた

ウェールズ語? そのための装置があるかもしれない

ハイア - M-SParc