NTTは12日、生成AI(人工知能)の基盤モデルに、図表を含めて文書を理解させる技術を世界で初めて確立したと発表した。これにより、生成AIが文章だけでなく、図表に基づいて回答できるようになる。
 同社の実験では、この技術を活用した基盤モデルは、米オープンAIの「GPT―4」を超える性能も示したという。NTTは、図表入りの書類を多く使う業務の自動化を加速させると期待しており、年度内の商用化を目指す。
 従来の基盤モデルは文章を理解するのは得意だが、図表を理解するのは苦手だ。NTTの「視覚読解技術」は、プレゼンテーション資料やマニュアル、論文などを画像として読解。図表を含めて基盤モデルに理解させる。 

(ニュース提供元:時事通信社)