HANAWA行政書士事務所のロゴ HANAWA行政書士事務所 建設・製造・産廃業向け 許認可 × 外国人雇用 × 補助金 × 福利厚生
090-3718-2803 9:00-23:00 年中無休(土日祝日・20時以降は事前予約)

AI導入を検討するとき、「どのAIツールを使うか」や「どのような指示を出すか」に目が向きやすいものです。しかし、実務で成果につなげるためには、AIが扱う情報そのものを整理しておくことも大切です。社内には、Excelの管理表、顧客情報、問い合わせ履歴、FAQ、議事録、マニュアル、メールなど、さまざまな情報があります。まずは現在の状況を整理してみることで、自社のAIデータ活用の可能性が見えやすくなります。

このセクションで学ぶこと

この回では、AIが扱うデータの種類と特徴を、事業会社の実務に引き寄せて整理します。構造化データ、非構造化データ、社内文書、ログ・履歴、画像・音声などを大まかに分類し、「自社にはどのような情報資産があるのか」を考えるための基礎を確認します。

前回までに、AIへの指示は目的・前提・条件・出力形式を整理して伝えることが重要だと学びました。今回扱うのは、その指示に加えて、AIに参照させる情報、整理させる情報、回答や判断材料のもとになる情報です。

基本解説:AIが扱うデータは表形式だけではありません

「AI データ活用」と聞くと、売上データや顧客管理表のような、数字や項目が並んだ表を思い浮かべる方も多いかもしれません。もちろん、Excelやデータベースに整理された情報は、AI活用において重要な対象です。

ただし、生成AIの導入では、表形式のデータだけでなく、文書・メール・議事録・FAQ・マニュアル・問い合わせ文なども重要な情報資産になります。事業会社の日常業務では、判断や対応の根拠が文章の形で残っていることも少なくありません。

たとえば、カスタマーサポート部門であれば、問い合わせ履歴、回答テンプレート、FAQ、対応マニュアルがあります。営業部門であれば、顧客管理表、商談メモ、提案書、メール履歴があります。管理部門であれば、規程類、手順書、会議メモ、社内通知などが関係します。情報システム部門であれば、問い合わせチケット、障害記録、運用手順書、システムログなどが対象になります。

AI導入に向けた最初の整理では、これらをすべて同じものとして扱うのではなく、「どのような種類の情報なのか」「どの業務に関係しているのか」「AIに何をさせたいのか」という観点で分けて考えると、社内で説明しやすくなります。

構造化データとは

構造化データとは、表やデータベースのように、項目が整理された情報です。行と列で管理されているExcel、顧客管理システム、販売管理システム、在庫管理システム、勤怠管理システムなどに入っている情報が代表例です。

たとえば、顧客管理表であれば「会社名」「担当者名」「業種」「商談状況」「最終接触日」「売上見込み」のように、項目ごとに情報が整理されています。このようなデータは、集計、抽出、条件検索、傾向把握などに使いやすい特徴があります。

構造化データは、数字や分類項目が整理されているため、業績管理、顧客分析、問い合わせ件数の把握、対応状況の確認などに向いています。ただし、項目名の定義が部署ごとに違っていたり、入力ルールが統一されていなかったりすると、活用の前に整理が必要になることがあります。

非構造化データとは

非構造化データとは、文章、会話記録、問い合わせ文、議事録、マニュアル、メール本文など、表の項目としてきれいに整理されていない情報です。形式が自由で、内容も文脈に依存します。そのため、人が読めば意味が分かる一方で、集計や検索には工夫が必要になります。

生成AIは、この非構造化データの処理において有効とされる場面があります。ただし、用途やデータ品質によって効果は異なります。文章の要約、分類、言い換え、回答案の作成、FAQ候補の抽出、議事録からのタスク整理、マニュアル文のたたき台作成などは、生成AIを活用しやすい領域として検討できます。

たとえば、問い合わせ履歴が大量にある場合、従来は担当者が一つひとつ読んで傾向を把握していました。生成AIを使うと、「問い合わせ内容をカテゴリ別に整理する」「よくある質問を抽出する」「回答案の草案を作る」といった使い方を検討できます。最終判断や顧客対応は必ず人間が確認する体制とし、誤回答や不適切対応によるリスク管理もあわせて考えることが重要です。

図解1:AIが扱う情報を大きく分けて考える

AI導入で扱う情報は、表形式のデータだけではありません。まずは「項目が整理された情報」と「文章中心の情報」に分けると、活用方法を検討しやすくなります。

構造化データ

Excel データベース 管理表

項目ごとに整理された情報です。顧客管理表、売上データ、在庫表、問い合わせ件数、対応ステータスなどが含まれます。

集計、抽出、比較、傾向把握に使いやすい特徴があります。

非構造化データ

文書 議事録 メール

文章や会話の形で残っている情報です。FAQ、マニュアル、問い合わせ文、会議メモ、提案書、社内通知などが含まれます。

要約、分類、文章生成、回答案作成などに活用できる有効なケースがあります。

この図で読み取ってほしい点は、AIデータ活用の対象を「数字や表」だけに限定しないことです。社内文書や履歴情報も、業務改革の材料になり得ます。

社内文書は、生成AI活用の重要な入り口になります

生成AIを用いた社内データ活用を考えるとき、多くの会社で最初に確認しやすいのが社内文書です。規程、業務マニュアル、FAQ、研修資料、商品説明資料、提案書、議事録、社内通知などには、業務の知識や判断基準が含まれています。

たとえば、新人教育でよく聞かれる質問がFAQにまとまっていれば、AIに質問対応の補助をさせる方法を検討できます。営業提案書が蓄積されていれば、提案書の構成案や説明文のたたき台作成に活用できるかもしれません。会議メモが残っていれば、決定事項やタスクの整理に役立てられる有効なケースがあります。

ただし、社内文書をAIに活用する場合は、「どの文書を使うのか」「最新版はどれか」「社外秘情報や個人情報(個人情報保護法上の『個人情報』および場合により『個人データ』『保有個人データ』に該当する情報)が含まれていないか」「誰が確認するのか」といった点もあわせて整理する必要があります。この点は、次回の「社内データをAI活用に使う際の注意点」で詳しく扱います。

ログ・履歴情報は、業務の実態を知る手がかりになります

ログや履歴情報も、AI導入では重要です。ログとは、システムの利用記録や操作記録、問い合わせ対応の履歴、チャットのやり取り、チケット管理の記録などを指します。業務の結果だけでなく、実際にどのようなやり取りや処理が行われているかを知る手がかりになります。

たとえば、問い合わせ履歴を確認すると、顧客がどのような表現で質問しているか、担当者がどのような説明をしているか、対応に時間がかかりやすいテーマは何かが見えてきます。これらは、FAQ整備、チャットボット検討、対応テンプレート改善、教育資料の見直しにつながります。

一方で、履歴情報には個人情報や機密情報が含まれることがあります。そのため、AI導入におけるデータ整理の段階では、活用可能性だけでなく、取り扱いルールも一緒に確認しておくと安心です。外部サービス利用時の取り扱い(国外サーバーへのデータ移転(個人情報保護法における越境移転規制への対応を含む)、委託先管理の適否等)も確認が必要になる場合があります。

画像・音声もAI活用の対象になる場合があります

AIの種類や用途、利用するサービスの機能によっては、画像や音声も扱うことが可能です。たとえば、製造現場の写真、店舗の陳列画像、手書き書類の画像、コールセンターの通話音声、会議録音などです。

画像や音声の活用は、文字情報よりも運用設計や確認事項が増えやすい分野です。初級段階では、「対象になり得る」と理解しておく程度で十分です。音声を文字起こしして議事録にする、写真から状況確認を補助する、紙資料をデジタル化して検索しやすくするなど、業務に近いところから考えると検討しやすくなります。

実務での考え方:まずは業務例から情報を分類する

AI導入の検討では、「当社にはどのようなデータがありますか」と聞かれても、すぐに一覧化するのは難しいことがあります。資料がそろっていない段階でも、業務の流れから整理できます。

たとえば、カスタマーサポートの業務であれば、顧客からの問い合わせが入り、担当者が内容を確認し、過去の回答やマニュアルを参照し、回答を作成し、対応履歴を残します。この一連の流れの中に、AIが扱える情報が複数含まれています。

図解2:問い合わせ対応に含まれる情報の流れ

業務の流れに沿って見ると、どの場面にどの種類のデータがあるかを確認しやすくなります。

入力 問い合わせ文

顧客から届くメール、フォーム、チャットなど。文章中心の非構造化データです。

参照 FAQ・マニュアル

回答の根拠になる社内文書です。最新版や利用範囲の確認が重要です。

記録 対応履歴・管理表

日時やカテゴリなどの項目は「構造化データ」、自由記述の応対メモや詳細な経緯は「非構造化データ」として切り分けて考えます。

この図では、問い合わせ文は非構造化データ、FAQやマニュアルは社内文書、対応履歴や管理表は構造化データと非構造化データの組み合わせとして捉えています。たとえば、対応日時・担当者・カテゴリ・ステータスは項目として整理された構造化データですが、応対メモや顧客との詳細なやり取りは文章中心の非構造化データです。AI活用を検討するときは、業務のどの場面で情報が発生し、どこで参照され、どこに記録されるのかを確認すると整理しやすくなります。

具体例:4つの情報を分類してみる

ここでは、よくある社内情報を例に、データの種類を整理してみます。厳密な分類名を覚えることよりも、AI活用の検討に使える見方を持つことが目的です。

情報の例 主な種類 特徴 AI活用の考え方
問い合わせ履歴 履歴情報・非構造化データ 顧客の質問文、担当者の回答、対応日時、カテゴリなどが含まれる 問い合わせ内容の分類、FAQ候補の抽出、回答案のたたき台作成に使えるケースがあります
FAQ 社内文書・非構造化データ よくある質問と回答が文章で整理されている 質問対応の参照情報、チャットボットや社内検索の基礎資料として検討できます
顧客管理表 構造化データ 顧客名、担当者、商談状況、最終接触日などが項目別に整理されている 条件抽出、優先順位付け、営業活動の振り返りなどに活用できます
会議メモ 非構造化データ・社内文書 議論内容、決定事項、懸念点、宿題事項などが文章で残っている 要約、タスク抽出、決定事項の整理、次回議題の作成に使いやすい情報です

このように分類してみると、AIが使える情報は一部の専門部署だけにあるものではないことが分かります。営業、サポート、管理、情報システムなど、さまざまな部門にAIデータ活用の入り口があります。

「何に使うか」とセットで見る

データの種類を整理するときは、「どの種類に分類されるか」だけで終わらせないことが大切です。実務では、「その情報を使って、どの業務を楽にしたいのか」「どの判断をしやすくしたいのか」とセットで考える必要があります。

たとえば、会議メモが大量にあるとしても、目的が曖昧なままでは活用方法を決めにくくなります。「会議後のタスク整理を早くしたい」「決定事項を抜け漏れなく共有したい」「過去の議論を探しやすくしたい」など、目的によって必要な整理の仕方が変わります。

生成AIは、文章を扱う業務で効果を検討しやすい一方で、参照する情報が古かったり、社内で正式に承認されていない資料だったりすると、出力の確認に手間がかかります。最初から完璧に決める必要はありませんが、目的と情報の対応関係を意識しておくと、検討を進めやすくなります。

実務上のポイント:AI導入で扱うデータを整理するときは、「どこにあるか」だけでなく、「誰が使っているか」「何の判断に使っているか」「更新されているか」も確認しておくと、社内で説明しやすくなります。

よくあるつまずき:データを狭く捉えすぎる

AI導入の初期検討でよくあるのは、「当社にはAIに使えるデータがない」と考えてしまうことです。これは、データを売上数値や顧客データベースのような表形式に限定して考えている場合に起こりやすい整理です。

実際には、社内には文章中心の情報が多く存在します。FAQ、業務マニュアル、議事録、問い合わせメール、社内チャット、提案書、報告書などには、業務知識や判断の背景が含まれています。非構造化データをAIで活用することを考えるときは、こうした文章情報も検討対象になります。

つまずき1:Excelだけをデータだと考えてしまう

Excelやデータベースは分かりやすいデータですが、それだけがAI活用の対象ではありません。文章で残っている知識や履歴も、要約、分類、検索補助、回答案作成などに活用できる有効なケースがあります。

つまずき2:文書の量だけで判断してしまう

文書が大量にあるからといって、そのまま活用しやすいとは限りません。最新版が分からない、部署ごとに表現が違う、似た資料が複数ある、承認済みかどうかが曖昧、といった状況もあります。

反対に、文書量が多くなくても、業務上よく使われる手順書やFAQが整理されていれば、小さく始める材料になります。できる範囲から確認していくと、現実的な活用方法を見つけやすくなります。

つまずき3:データの種類とリスクを切り離して考えてしまう

顧客情報、社員情報、契約情報、問い合わせ履歴などには、個人情報や機密情報が含まれることがあります。AIでデータを扱う際は、業務上の有用性だけでなく、個人情報保護法や機密保持契約(NDA)への抵触を防ぐためのデータ保護ルールを確認する必要があります。たとえば、機密情報の入力禁止、利用するAIサービスの設定確認、学習利用の有無およびオプトアウト設定または学習不使用設定の有無の確認、アクセス権限の整理などが検討対象になります。

また、AIが生成した文章をそのまま社外向けに利用する場合は、内容の正確性だけでなく、各種法令や契約上の制約にも注意が必要です。たとえば、健康食品・美容・医療に関係する表現では薬機法(医薬品医療機器等法)などが問題になることがあります。既存資料や他社コンテンツに近い表現では、著作権法上の問題(類似性・依拠性の観点)について確認が必要になることもあります。最終的には、人間が内容を確認し、必要に応じて法務部門や外部専門家(弁護士等)に相談できる体制を整えることが大切です。

今回はデータの種類を理解する回ですので、リスク管理の詳細には入りません。ただし、データの分類は、後続の社内データ確認、RAG(Retrieval-Augmented Generation:検索拡張生成)の検討、マニュアル整備、利用ルール作りにつながる基礎になります。

経営者・責任者向けの確認ポイント

経営者や責任者にとって重要なのは、「どのツールを入れるか」だけでなく、自社の情報資産がどの業務価値につながるかを把握することです。AI導入は、保有している情報の質や使われ方によって、進め方が変わります。

たとえば、問い合わせ対応の効率化を考える場合、AIツールの機能だけを比較しても十分ではありません。問い合わせ履歴は残っているか、FAQは更新されているか、回答の承認ルールはあるか、顧客情報との関係はどうなっているか、といった確認が必要になります。

営業活動でAIを使う場合も同様です。顧客管理表があっても、入力ルールがバラバラであれば、AI活用の前に項目や運用を見直した方が進めやすいことがあります。提案書や商談メモが蓄積されていれば、文章生成やナレッジ共有の観点から活用可能性を検討できます。

経営者・責任者が見ておきたい3つの観点

  1. 情報資産の所在:重要な情報がどの部署、どのシステム、どのフォルダにあるか。
  2. 業務価値との関係:その情報が、問い合わせ対応、営業活動、管理業務、教育、意思決定のどこに関係しているか。
  3. 利用ルールの有無:誰が使える情報なのか、外部サービスに入力してよい情報なのか、確認者は誰か。

AIデータ活用は、情報を多く持っている会社ほど有利という単純な話ではありません。少量でも、よく使われ、更新され、業務上の判断に関係する情報であれば、導入検討の出発点になります。まずは現在の状況を整理してみましょう。

AI導入支援者としての着眼点

AI導入コンサルタントを目指す方や、社内でAI推進を担う方は、顧客企業や自社の情報環境を確認するときに、データの種類を分類する視点を持っておくと役立ちます。

ヒアリングでは、いきなり「データベースはありますか」と聞くよりも、業務の流れに沿って確認する方が、実態を把握しやすくなります。たとえば、「問い合わせはどこから入りますか」「回答時に何を参照していますか」「対応結果はどこに記録していますか」と聞くと、構造化データ、非構造化データ、社内文書、履歴情報が自然に見えてきます。

1. 業務の入口を確認する

問い合わせ、申請、依頼、商談、会議など、情報が発生する場面を確認します。

2. 参照している資料を確認する

FAQ、マニュアル、過去メール、規程、提案書など、判断や回答に使う情報を確認します。

3. 記録先を確認する

Excel、CRM、チケット管理ツール、共有フォルダ、チャットなど、記録の残り方を確認します。

4. 活用目的を確認する

要約したいのか、探したいのか、分類したいのか、回答案を作りたいのかを整理します。

支援者としては、「この会社にはデータがあるかないか」と単純に評価するのではなく、「どの業務に、どの種類の情報があり、どの程度整っているか」を一緒に整理する姿勢が大切です。相談内容がまとまっていなくても、業務の流れをたどることで確認できることは多くあります。

ミニチェックリスト

自社でAI導入におけるデータ整理を始める際は、次の項目を確認してみてください。すべてを一度に整える必要はありません。できる範囲から見える化すると、次の検討に進みやすくなります。

  • Excel、管理表、業務システムなど、項目が整理された構造化データがどこにあるか確認した
  • FAQ、マニュアル、議事録、メール、提案書など、文章中心の非構造化データを洗い出した
  • 問い合わせ履歴、対応記録、チャット履歴など、業務の実態が分かる履歴情報を確認した
  • 社内文書について、最新版、管理部署、利用範囲が分かるか確認した
  • AIに何をさせたいのかを、要約・分類・検索補助・文章作成などに分けて考えた
  • 個人情報や機密情報が含まれる可能性のあるデータを区別した
  • AIサービスへの入力可否(利用規約・データ利用条件の確認を含む)、学習利用の有無、オプトアウト設定または学習不使用設定、外部委託や国外移転の確認が必要な情報を整理した
  • 生成された文章を人間が確認する体制や、法令・契約上の確認が必要な場面を検討した
  • 次に詳しく確認したい部門や業務を一つ選んだ

まとめ:AIが扱う情報を分類すると、導入検討が進めやすくなります

今回は、AIが扱うデータの種類と特徴を確認しました。AI導入で扱う情報には、表形式のデータだけでなく、文書、メール、議事録、FAQ、問い合わせ履歴、マニュアル、ログ、画像、音声なども含まれます。

構造化データは、表やデータベースのように項目が整理された情報です。集計、抽出、比較、傾向把握に向いています。非構造化データは、文書や会話記録、問い合わせ文、マニュアルなど、文章中心の情報です。生成AIは、非構造化データの要約、分類、文章生成、回答案作成などで有効とされる場面がありますが、用途、データ品質、社内ルール、確認体制によって実務上の効果は変わります。

データの種類を理解しておくことは、後続の社内データ確認、RAG(Retrieval-Augmented Generation:検索拡張生成)の検討、マニュアル整備、利用ルール作りにつながります。次回は、社内データをAI活用に使う際の注意点を扱います。活用可能性だけでなく、情報の正確性、機密性、権限、更新管理、法令・契約上の確認なども含めて、実務で確認した方がよい内容を整理していきます。

あわせて確認したいこと

契約書・通知書などの文書を確認したい方へ

契約書、通知書、内容証明、行政機関へ提出する書面では、形式だけでなく、誰が、何を、いつまでに行うのかが伝わることが大切です。文書の内容を整理したい方は、関連するご案内をご覧ください。

契約書、通知書、内容証明、提出書類の表現に不安がある場合は、文書の目的と伝えるべき内容を整理できます。

前のページに戻る