Nuxeoは1月、長期サポート(LTS)製品の最新版をリリースしました。その名もLTS 2019 です。このリリースは、2つの理由から非常に重要です。第一に、Nuxeoが新しい時代を幕開けすること。2019年以降、弊社では、継続的なイノベーションモデルへと移行し、新しい機能が開発されるごとにNuxeo Cloudでのリリースに導入していきます(これについては追って今月中に詳細をお知らせします)。そして第二に、 LTS 2019には人工知能(AI)と機械学習(ML)を活用した大きな改良点がいくつも盛り込まれていることです。

AIとMLは巷で盛んに取り沙汰されていますが、話題になるだけの価値があると、私は考えています。今の世の中は間違いなく、情報管理革命の真っただ中にあります。 過去何年にもわたって私たちは、コンテンツとデータの間、構造化情報と非構造化情報の間に、不適切かつ人工的な線引きをしてきました。これが多くの場合、コンテンツを二次的な地位へと追いやり、機会というよりは解決が難しい問題と見なす結果を招いてきました。

でも、よく考えてみてください。コンテンツ、すなわち非構造化情報はすべての情報の80%を占めているというのが、大方の見積もりです。しかも重要なことに、人間が生成する情報はすべてコンテンツです。コンテンツこそが、人間行動のあり方なのです。私たちは、コンテンツを介して他の人とコミュニケーションし、コラボレーションしています。コンテンツを使って意思決定を行い、コンテンツを使って大量のデータを分析しています。そのうえ、リッチメディアの爆発的成長を受けて、顧客を楽しませ魅了する手段もがコンテンツになってきました。要は、今どきの企業にとってコンテンツはきわめて重要だということです。にもかかわらず、ほとんどの企業は、どうやってコンテンツを作成し、保存し、配信し、さらには「管理」するかにばかり気を取られています。

コンテンツを真の情報資産ととらえている企業が非常に少ないのです。

その理由は単純です。コンテンツは複雑で、管理しにくいからです。しかも、たいていの場合、コンテンツを解釈し、その相対的価値を評価するには、人間の力が必要になります。しかし、AIとMLの出現により、コンテンツとデータの間の垣根が取り除かれつつあります。今では、非構造化情報の理解を高めてくれる自動化ツールが登場し、貴重なデータを抽出できるばかりか、その本質について洞察をもたらしたり、作者の心情を解釈したりすることまで可能になっています。つまり、コンテンツの価値を高め、すばやく検索して便利に再使用し、正確に配信し、インテリジェントにマイニングする未曾有の能力がもたらされつつあるのです。これが新たな競争力の源となり、今日の企業に変革をもたらしています。

AIは実用レベルに達しているのか

AIとMLのもたらす未来図を描いたところで、Nuxeoの現在、そしてLTS 2019に盛り込まれた機能 についてご説明しましょう。

Nuxeoでは昨年、AIのフレームワークを発表しました。Google VisionとAmazon Rekognition、さらにはAmazon Comprehendなどの各種サードパーティAIに幅広く対応し、統合することのできるフレームワークです。コンテンツ管理あるいはデジタル資産管理(DAM)の他の一部のソリューションと同様に、弊社はこれらのツールを使用して、画像に一般的なタグを付け、コンテンツを自動区分し、ドキュメントやコミュニケーションの感情を分析できるようにしました。動画コンテンツのタグ付けも可能になっています。

しかし同時に、これらのツールが素晴らしいデモに役立つ一方で、弊社のお客様にもたらす事業価値はそれほど高くないことも認識しています。画像や動画に機械がタグを付けるのを見ると、感心してしまうのは確かです。とは言うものの、これらのツールが本当に語ってくれることは何なのでしょうか。タグ付けのモデルが本当のところどれだけ価値をもたらすのでしょうか。Google Visionをはじめ、ほとんどの汎用的なAIエンジンの問題は、汎用的だという点です。画像に何が写っているかは確かに見分けてくれますし、その点でコンテンツの価値を高めることには長けていますが、その情報が事業にとって本当にどれだけ価値があるかは、批判的に論じるべきところでしょう。

また、タグやレベルがコンテンツや資産の検索と検出で有益な機能を果たすことは認めますが、それ以外にあまり役に立つとも思えません。ほとんどのコンテンツ管理システム(Nuxeoも含まれます)では、タグは通常、テキストオブジェクトの1ストリングとして1つのフィールドに記録されます。このため、タグを使ってワークフローや具体的な事業活動を起動することはできません。ユーザが有意義な方法でタグとインタラクションするのも困難です。例えば、画像に付けられたデータの精度を確認することは難しいでしょう。

では、今の時点で何が言えるのでしょうか。第一に、 LTS 2019では、お客様の独自のAIモデルを導入して学習させることが可能です。 これを弊社では業務専用AIと呼んでいますが、大きな違いは、お客様が独自のデータを使って、業務特有のニーズに合わせたAIモデルを構築できることです。第二に、 Nuxeoは、AIからの抽出情報を完全にサポートするようになりました。このため、AIエンジンの生成したデータを特定のメタデータフィールドにマッピングすることができます。

この結果、AIエンジンに学習させてドキュメントや資産についてより正確なデータを提供できるだけでなく、この情報を抽出してメタデータとして活用することができるのです。
なぜこれが重要なのでしょうか。 タグは画像の検出に役立つ一方で、メタデータははるかに多くのことを可能にするからです。画像のキャプチャを真に自動化する、ワークフローとその後のビジネスプロセスを起動する、さらには新しいコンテンツや資産を保留中のタスクや業務に関連付けることも可能です。

これが何を意味するのか

これらすべてがいったい何を意味するのかを、単純なシナリオを使って説明してみましょう。これは、フォード製のピックアップトラック「F-150」の写真です。1986年以来、米国でベストセラーの車種です。

NuxeoのAI

皆さんのお手元でもテストすることができますが、これをドラッグ&ドロップすると、Google Visionは、「Motor Vehicle」や「Pickup Truck」のような一般的なタグを画像にいくつもタグ付けします。また、「Ford」と「Ford F-Series」というブランド固有のタグも付けてくれました。

これに事業上の具体的な価値があることを否定するつもりはありません。Google Vision は、ブランドと車種のシリーズを正しく特定したのです。さらには、シリーズの中のモデルも特定し、「Ford F-350」および「Ford Super Duty」というラベルを画像に付けました。でも、これは「Ford F-150」トラックです。つまり、基本的にGoogle Visionは画像にデータを関連付けることはできるのですが、そのデータはかなり一般的で、間違っていることもあります。

また、Google Visionが、画像の中心で前景に写っているものを重視する傾向にあることも分かります。このため、「Wheel」、「Tire」、「Fender」、「Bumper」のタグは付けられましたが、画像の背景に写っているものにはまったくタグがありません。

では、同じ画像をもう少し業務特有の視点から見てみましょう。

Nuxeoの人工知能

私がFord社のマーケティングチームで働いていたなら、この画像が「F-150」の画像であることは是非とも知りたいところです。「リミテッドエディション」も重要です。4ドアの「SuperCrew」モデルで、色は「Agate Black」です。22インチタイヤで、クローム製のホイールセンターキャップを装備していることも欠かせません。さらには、この写真の背景にボートが写っているか、夕焼けが写っているかも知りたいと思うかもしれません。これらが業務特有データです。端的に言って、データが企業に真の価値をもたらすには、事業の具体的なニーズに応えなければなりません。だからこそ、Nuxeoのようなコンテンツサービスプラットフォーム にとっては、完全にトレーニングされたカスタムAIのモデルが重要なのです。

もうひとつ重要な点として、私がこの写真に含まれるデータを違った方式で列挙したのにお気付きになったでしょうか。無作為に並べたテキストストリング、すなわちタグではなく、真のメタデータ抽出を行ったのです。ブランド、モデル、装備、色などの値は、適切に抽出され、固有のデータフィールドに入れられました。これにより、より正確なパラメータ検索が可能になるだけでなく、新しい資産やコンテンツを特定のワークフローや保留中のアクティビティにマッピングできるようになります。しかも、これらのメタデータフィールドを人間が確認したいと思った場合に、作業しやすい直観的な形式で提示するのもはるかに簡単です。

スマートだけど、ものが分かるのか

ひとつ確実に言えるのは、人工知能が私たちの周りの世界を変えつつあり、コンテンツやデジタル資産の業務を変えつつあることです。しかし、「スマート」と「ものが分かる」の間には違いがあり、AIエンジンが真に価値をもたらすには、ビジネスが分かるようにならなければなりません。

LTS 2019がNuxeo Platformにとって重要である理由はそこにあります。この2019リリースを通じて、弊社はお客様にカスタマイズ可能な機械学習モデルを提供し、独自のデータセットで学習させる機能をもたらしました。また、真の情報抽出もサポートし、データ値を具体的なメタデータフィールドにマッピングして、単純なタグ付けの域を越えることを可能にしています。

次回のブログでは、弊社のAI機能の2019年のロードマップについて触れ、これらの機能をどのように活かしていくつもりかをご説明します。また、弊社がAIに対して貫いている4つの原則と、AIとMLがお客様にもたらす価値についての長期的なビジョンもご紹介します。