AI

アノテーション(annotation)とは? 意味、事例、AIにどう使う?

株式会社エム・フィールグループでAIに特化した、株式会社エイアイ・フィールド(以下、AIF)でプロダクト開発を担当している若林勇人です。好きな色は、ターコイズブルーです。

以前、「AI開発・AI研究に、どんどん使ってください!1,000人分のアノテーションデータをAPTOと無償提供します!」という記事を書いたのですが、「アノテーション」という言葉がまだまだ浸透してないと感じたので、今回の記事では、アノテーションについて詳しくご説明します。
アノテーションとは?アノテーションデータはAIの機械学習にどう必要なのか?という初歩的な内容を、初心者の方にもわかりやすく説明します。

■アノテーションの意味


Annotation=「注釈」という意味です。AIを開発するには、機械学習のために取り込む学習データが必須です。アノテーションデータとは、テキストや画像などのデータに、例えば、上図のように、性別や年代などの関連した情報を付与(タグ付け)した学習データを指します。アノテーションデータは、機械学習モデルの学習、検証、テストの際に用いられるため、その正確性がAIプロダクトの質・精度に大きく影響する重要なデータです。

AI開発、機械学習における「アノテーション」は、ウェブサイトのSEO対策やYouTubeのアノテーションとは全く別のものなので、ここではAI開発におけるアノテーションについてご説明していきます。

アノテーションをする対象の元データは、大きく画像、動画、文章、音声の4つです。対象となるデータに対して、属性(男女、年齢、犬猫、要不要など)の区分をしたり、一つ一つの画像や言葉の意味付けを行ったり、対象となる範囲を限定するなど、これから開発するAIに必要な注釈を一つ一つ人間の手で付加していきます。

AIは、多くの正確なデータを読み込んで学習させるほど、(正確なデータを大量に学習させるほど)、より精緻な判断をくだせるようになります。その学習データの元になるアノテーションデータの正確性や客観性は、開発するAIの質に直結します。だからこそ質の高いアノテーションデータは、機械学習において非常に重要とされています。

しかし、先述したようにアノテーションは、人間が手作業で行うため、判断する人によって偏りがでることがあります。人為的なミスや偏りを最小限にするために、一つのデータに対して複数人が同じ作業をして、平均値をとったり、多数決で決めたりします。この作業の円滑化と正確性の向上のために、さまざまな企業がアノテーション用に独自のプラットフォームを開発しています。

次に、対象データごとのアノテーションの事例を見ていきましょう。

■画像や動画のアノテーション

エイアイ・フィールドは、特にAIを使った画像解析のプロダクトを多く開発しているため、画像のアノテーションを行うことが多いです。先述の私の担当しているプロジェクトでは、顔写真に性別と年齢をアノテーションしていますが、このように画像や動画に含まれる視覚情報を分類するアノテーションを「画像分類」と言います。

画像を分類するアノテーションのもう一つの例として、株式会社ALBERT様の「服のカテゴリの自動分類タグ付け」があります。
URL:https://www.albert2005.co.jp/service/case/classification

これは、衣類の画像に対して、画像分類を用いて、「上品」「爽やか」などの、検索用のタグを自動的に付与するサービスです。

・範囲の特定「領域抽出」


*写真はイメージです。実際のアノテーションツールの画面とは異なります。

画像の中のどの部分が対象物なのか?というように、範囲を特定するのも画像アノテーションの一つです。対象の範囲を特定するアノテーションを「領域抽出」といいます。

画像の中から選び出す「物体検出」

画像データに含まれる物体が何なのかをラベリングしていくアノテーションが、「物体検出」です。

・画像の中からポイントを指定する「ランドマーク設定」

特に表情の分析をする場合に、目・鼻・口・眉など顔のパーツの中でランドマークになるポイントをラベリングするアノテーションもあります。また、人間や動物の体の動きを分析するために体の関節や、手足などの部位を特定することもあります。

■自然言語(文章・音声)をアノテーションする

自然言語のアノテーションでは、「分類」、「音声読み上げの評価」、「固有表現抽出」などがあります。

自然言語処理の分野では、以前COLORSにも掲載されていた、「絵文字に感情のラベルを付与する」、などの事例があります。

これは、「顔文字から感情を推定する」AIを作成する際に用いられます。
以下の図のように、顔文字に対して「かわいい」「驚き」などの感情のラベルを付与してアノテーションします。このデータをAIが学習することで、例えば「(○^▼^)」という顔文字が、どのような感情を持つのかを推定することができます。

この「顔文字から感情を推定する」AIは、例えば「twitterの文章から感情を分析する」システムを構築する際に役立てることができるかもしれません。

※詳しくは、以前掲載された記事をご参照ください。

*顔文字を自然言語処理と画像処理のAIで分類してみた!! 前編

*顔文字を自然言語処理と画像処理のAIで分類してみた!! 後編

■アノテーションデータを作る時に気をつけること

アノテーションは、人の主観でデータを区分していく技術です。多くの人がアノテーションを行う際には、事前に基準を定めておき、アノテーションに着手してからなるべく早い段階でレビューや認識合わせを行うようにしています。

アノテーションの基準の例としては、ある画像から顔部分をアノテーションする場合、「髪を含めるのか、含めないのか」など、「顔がどの部分までをさすのか」というように、明確な基準を定めておく必要があります。この基準がバラバラだと、アノテーションする人によって解釈が変わってしまい、アノテーションの精度が落ちる要因になります。

画像のアノテーションをする際のレビューでは、余計な部分をアノテーションしていないか?ラベルは適切か?主観が入りすぎていないか?などをチェックして、品質を高めるように努めています。

正解があるアノテーションの場合は良いのですが、感情の読み取りや、年齢を推定するなどの人の五感を使ったアノテーション作業の場合、さまざまな解釈が成り立ちます。
例えば、「(^-^)/」という絵文字を見て、「挨拶」と判断する人と、「笑」や「かわいい」と判断する人がいるかもしれません。いずれも間違った答えではありませんので、複数人に判断してもらって多数決で決定するという解決策が考えられます。

■アノテーションデータの拡張 

大量の質が担保されたアノテーションデータは、精度の良いモデルの作成に繋がります。繰り返しになりますが、AIの精度は「データの量」に大きく依存するので、アノテーションデータをできる限り収集することは非常に重要です。

アノテーションデータが十分集まらない場合には、データ拡張(アノテーションデータの生成)を行うことも多くあります。


例えば、株式会社ロボケン様害虫判定システムでは、捕虫シートの画像から、虫の種類と数を判定することができます。

しかし、学習に使用する虫のデータを実際に収集することは困難なので、学習データの拡張(色を変える、回転する、拡大する、反転するなど)を行い、精度を向上させているようです。学習データの拡張ノウハウは、その会社の非常に重要な技術となることもあります。

また、理科学研修所と国立がん研究センターは、少数の正解データにから構築されたAIによる、早期胃がんの高精度な自動検出法を確立したことを2018年7月に発表しています。

早期の胃がんの精度の高い画像を大量に集めることは難しいことですが、少数の正解画像から、小さな領域をランダムに切り出して、データ拡張技術を利用することで、データの量を36万枚にまで増加させ、AIの学習精度を向上させました。その結果、陽性的中率(コンピュータが「がん」と判断した画像中、実際に「がん」であった割合)が93.4%、陰性的中率(コンピュータが「正常」と判断した画像中、実際に「正常」であった割合)は83.6%まで高まりました。加えて、早期胃がんの有無に加えて、その領域まで高精度で自動検出することに成功したそうです。

「AIで早期胃がん領域の高精度検出に成功。早期発見・領域検出で早期治療に大きく貢献」2018年7月20日

https://www.ncc.go.jp/jp/information/pr_release/2018/0721/index.html

■手塩にかけたアノテーションデータを商用OKで無償配布します!

今回、当社が作成したこの世に存在しない顔画像3000枚に、APTO様が性別と年代のアノテーションデータを付与したデータセットを、商用OKなデータとして、無料、無償で配布します。属性(年齢や性別)の判定に関連したAIシステムの開発などに、本データセットを活用していただければ幸いです。

今回配布する属性情報を用いれば、マーケティング軸での施策を検討することも想定できますが、身近なところでいくと、自分の顔年齢を判定するサービスを作成してみるのも面白いかもしれません。

これからも、エイアイ・フィールドは、さまざまなAIサービスを提供してまいりますので、協業にご興味のある方は、ぜひご連絡ください。


自社のビジネスをITで革新したい!DXを一から相談できるパートナーを探しているなら、私たちエム・フィールドにご相談ください。

エム・フィールドは、「AIを武器にDXを前進させる」を合言葉に、DXに悩む企業に寄り添うシステム開発会社です。課題の洗い出しからシステム開発、技術支援、社員教育まで、幅広くご相談ください。

エム・フィールド グループへのご依頼・ご相談
解決できるDX課題
DXの悩みを解決する5つのサービス形態
DXを実現する12のテクノロジー
会社紹介資料のダウンロード

あなたもエム・フィールド グループで働いてみませんか?

エム・フィールドグループは事業拡大に伴い、一緒に働く仲間を通年で募集しています。
データサイエンティスト、エンジニア、クリエイターなど様々な職種を募集しています。ご興味のある方は、採用サイトもご覧ください。

エム・フィールドグループ 採用サイト
・人事が考える、エム・フィールドを一言で表すと、〇〇な会社!