技術が急速に進化する現代において、最新の特許情報を追跡するために必須となるSDI調査。AIを活用した特許検索・分析プラットフォーム「Patentfield(パテントフィールド)」のAI分類予測機能を利用すれば、このSDI調査を効率的に行うことができます。
SDI調査のSDIとは、Selective Dissemination of Information(情報の選択的配信)の略です。どのような特許が出されているかを調べる特許調査の1種で、特定のキーワードや技術分野に関連する特許公報の情報を一定の期間ごとに収集することで行われます。
これにより、企業の知的財産部門や研究開発部門の担当者は、自社の事業や研究開発に影響を与える可能性のある公報を定期的に追跡することができます。
SDI調査の目的は、最新の技術動向や競合他社の活動を定期的に監視することにあります。新商品の開発や既存製品の改良において、関連する技術分野の最新情報を迅速に把握することは、戦略的な意思決定に不可欠です。また、自社の特許が侵害されていないか、自社の新しい開発が他社の特許を侵害していないかを確認するためにも、SDI調査は重要です。
SDI調査によりリスク管理を強化し、また新しいビジネスチャンスを見出すことができます。
SDI調査では、まず自社の事業もしくは自社のサービスに関連する検索条件を元に検索式を作成します。これらの条件は、特定の技術分野、キーワード、分類コード、また特定の出願人や発明者に関連するものなど、さまざまな形で設定されます。
これらの検索式に基づいて、例えば週に一度や月に一度検索を行い、該当する特許公報を収集します。
その後、収集した特許公報を1つ1つ読み込み、必要な情報を抽出します。
SDI調査は一般的に、検索システムのSDI機能を使って行われています。検索式を予め設定しておけば、条件に合致した特許公報が定期的また自動的に電子メール配信されるため、これにより業務負荷を軽減することができます。
しかし多くの場合、検索式の検索条件は漏れをなくすために広めに設定されており、収集される情報量は膨大になる傾向にあります。例えば、1つの検索式あたり500件がヒットし、10個の検索式を設定している場合には、合計で5000件の特許公報が収集されます。これらの膨大な情報の中から、自社にとって重要なものとあまり関係のないものを選別する必要があり、担当者の大きな負担になっています。
Patentfield(パテントフィールド)は、4つの機能を組み合わせてワンストップで総合的な検索・分析ができる『AI特許総合検索・分析プラットフォーム』です。
AIを駆使して、従来高度な知識と膨大な時間を要する特許調査・分析業務において、はじめてでも操作しやすく、極めて効率の高いスクリーニングプロセスを提供しています。
Patentfieldの機能の1つであるAI分類予測を利用すれば、SDI調査における情報選別の業務負担を大幅に軽減することができます。
AI分類予測とは、予めユーザーがセットした教師データに基づき、任意の検索結果や母集合について、AIが分類予測を行う機能です。これにより、例えば技術的には近い内容だが構成要素が一部違うノイズとなりうる文献の順位を下げるなど、より効率的に調査を行うことができます。これまで人が読み込み仕分けしていた作業を、AIの自動分類により大幅に効率化することができます。
AI分類予測は、教師データファイルと予測データファイルを用意するだけで、3つの簡単なステップで実行可能です。
2値(ポジティブ/ネガティブ)または任意の数の独自分類を示す教師ラベル(多値)を設定した「教師データ」を登録します。Patentfieldでは、最大1万件の教師データを約数秒〜10秒以内に高速に学習させることができます。
教師データの登録は、 ①検索結果画面からの入力、②CSVファイルの読み込み、③設定画面での直接入力等、ご利用シーンに応じた柔軟な対応が可能です。
教師データ設定後、予測データを登録します。予測データは、SDI新着公報の公報番号リスト(CSVファイル)により簡単に登録可能です。
登録されたデータは、AIにより数秒で分類され、分類結果のダウンロードも簡単です。なお、Patentfield上で検索式を登録しSDI調査を行ったデータはもちろん、別の検索システムで収集したSDI調査データを登録することも可能です。
登録された予測データは、最大で10万件まで数秒以内でAIが分類を付与し、AI予測スコアを生成します。
付与された「AI予測ラベル」に対して、「人手正解ラベル」を設定し、精度向上を図ることができます。
「予測データで番号検索」をクリックすると、検索結果画面に移動し、各公報内容と予測結果のAIスコアを確認可能です。また、必要に応じて教師データの登録が可能で、スムーズなフローで精度向上を図ることができます。
なお、予測スコアは-1~1の数値で示され、1に近いほど確度が高い(教師データに近い)ことを示しています。
企業のグローバル化が叫ばれて久しい昨今、技術開発もまたグローバルな視野で行われています。したがって、特許調査においても、国内だけでなく海外の特許情報を把握することが必要となっています。特に最近では、米国や中国での出願件数の多い国のSDIは、言語の問題に加え、日本よりSDI件数も多く、査読により多くの労力がかかっています。
Patentfieldの提供するAI分類予測機能は、日本語・英語に対応しており、例えば米国文献による教師データに基づいて、US/EP/WO(英語のみ)の文献について、分類予測することができます。
さらに、「日本語横断検索オプション」を活用いただくことで、翻訳による表記ゆれをAIセマンティック検索がカバーしつつ、米国・欧州・中国・韓国・台湾・WO各国横断のAI分類予測を実現。AIによる海外文献の社内分類予測や、2値分類を利用したノイズ除去で、海外特許調査のスクリーニングの効率化を可能にします。
「対象特徴量」とは、単語、文書を機械学習させた概念をもとにした文書特徴量のことをいいます。「対象特徴量」を選択することで、公報のどの部分に基づいて、分類予測を行うかを選択することができます。
PatentfieldのAI分類予測では、各公報が持っている「特徴キーワード」(特徴量)を利用して、教師データとの類似度を計算し、予測を行っており、選択する「対象特徴量」によって、予測値は少しずつ異なります。
Patentfieldでは、豊富な「対象特徴量」をご用意、用意できる教師データの量や、厳密な分類の要否など、用途やニーズに応じて対象特徴量を選択いただくことが可能です。また、これら豊富な対象特徴量を利用したパラメータの自動チューニング機能も備え、AIの予測精度の向上に貢献します。
AIによる予測結果は、完全ではなく、間違っているケースも少なからず存在します。SDI調査の観点からすれば、AIが予測した結果が完全でなければ、結局は全件調査が必要ではないか、という懸念が残り、スクリーニング効率を大きく向上させることはできません。
Patentfiledでは、下記の2つの特長で、継続的な精度向上に貢献します。
■予測結果に対するフィードバック
AIにより分類予測された結果に対し、公報内容を確認しながら人の手で正解ラベルを割り当て、教師データとして新たに登録可能可能です。
この一連のフィードバックは、優れた操作性で、簡単に設定可能です。
■精度測定が可能
Patentfiledでは、検証用データを用意することで、簡単に精度測定が可能です。
精度測定では、下記の4つの項目を簡単に測定でき、これらの情報を確認しながら、継続的な精度向上が可能です。
なお、測定結果においても、上記同様、簡単なフィードバック機能で、判定のズレを修正し、教師データへ反映させることができます。
【検証可能な項目】
・精度:すべての予測に対する正しい予測の割合を示します。
・適合率:AIが「ポジティブ」と予測したデータの中で、実際に「ポジティブ」だった確率を示します。
・再現率:正解値が「ポジティブ」であるデータ全体のうち、AIによる予測値も「ポジティブ」だった確率を示します。
・F値:上記「適合率」と「再現率」の2つの値を調和平均した値で、1に近いほど、効率よくバランスの取れた機械学習モデルであることを示します。
(※参考:AI・機械学習の用語辞典)
Patentfieldでは、パラメータチューニング機能も備えています。
この機能を利用することにより、AI分類予測で利用するパラメータの最適値を自動で探索でき、その最適値を利用することで予測精度の向上を図ることができます。
最大10までの「チューニング対象特徴量」を選択可能で、チューニングが完了すると、これら「対象特徴量」ごとに測定結果が表示され、最も高い精度が期待される最適なパラメータ簡単に設定、反映させることが可能です。
なお、取りこぼしを少なくしたい場合は、再現率を重視する、誤検出を少なくしたい場合は、適合率を重視するなど、チューニング結果をもとに任意のパラメータを選択することも可能になっています。
Patentfieldは、オプションでAPI連携サービスもご用意しています。
API連携を利用することで、特許検索機能をはじめとする、Patentfieldの多彩な各機能をAPI経由で利用可能になり、社内運用のグループウェアへの組み込みや、特許に関する独自アプリケーションの開発などを可能にします。
AI分類予測機能においても、例外なくAPI利用が可能となっており、これにより、ユーザーニーズに応じた下記のような効率的な運用を実現します。
・エクセルでの社内分類の自動付与
・分類付与の複数多段バッチ実行
・Patentfieldで作成した検索式による定期自動ダウンロード・配信・分類付与
・開発者 / 技術者による簡易な先行技術調査の仕組みの構築