一般社団法人 『データで考える力』イニシアティブ

第5回:「内容分析」という意味解釈法から会議の議事録や会話を読み解く研究法の適用概念の可能性についての一考察

意味解釈法の類型

  1. カテゴリー分析
  2. テキスト分析
  3. パーソナル・ナラティブ分析
  4. グラウンデッド・セオリー
  5. 内容分析
  6. 意味論的分析
  7. シンボリック相互作用主義
  8. テーマ分析
  9. コンテキスト分析
  10. ディスコース分析

 内容分析という意味解釈法の手法を使って「コミュニケーションの意味づけに関する推論」を検証分析することを考えたい。会議は、コミュニケーションの場であり、暗黙知共有の実践の場でもある。知識は形式知と暗黙知によって構成されるが、通常は、言語化されて、記録され、データ化されて行く際に、削ぎ落とされていく知識の交換をメッセージの媒介を通して、データの素材から研究対象であるコミュニケーション対話当人同士の客観的な俯瞰情報としてデータ基盤化できる。

 また、ChatGPTの登場により、自然言語処理の進化とともに、実践的に内容分析自体が効果的な分析結果をもたらすと考えられる。


 質的研究法の内容分析は、テキストや文書、インタビューのトランスクリプトなどの質的データを分析する手法である。内容分析は、研究質問に関連するテーマやパターン、傾向を特定し、データから意味を引き出すために使用される。以下に、内容分析の基本的な手順を説明する。

  1. データの収集:
    質的研究の場合、インタビューや観察、文書などの方法を使用してデータを収集する。データは、テキスト形式で保存される場合が一般的である。
  2. データの準備:
    収集したデータを整理し、適切な形式に変換する。テキストデータの場合、トランスクリプトを作成したり、必要な情報を抽出したりすることが含まれる。
  3. コーディングの設計:
    分析のためのコーディングスキーム(コードブック)を設計する。コーディングスキームは、テーマやカテゴリを示し、データを分類するために使用される。研究の目的や研究質問に基づいて、適切なコーディングスキームを作成する。
  4. コーディング:
    コーディングスキームに基づいて、データを分類する。テキストデータの場合、キーワードやフレーズを特定のカテゴリに関連付ける方法が一般的である。コーディングは手作業で行う場合もあるが、一部のソフトウェアやツールを使用することもある。
  5. パターンやテーマの特定:
    コーディングの結果を分析し、特定のパターンやテーマを見つける。関連するカテゴリやテーマをグループ化し、データの傾向や特徴を理解するために分析を行う。
  6. 解釈と報告:
    分析結果を解釈し、研究の目的に対する洞察や理解を導き出す。研究の結果を報告する際には、見つかったパターンやテーマについて詳細な説明や引用を含めることが一般的である。

 質的研究法の内容分析では、主観的な要素を含むデータから意味を引き出すため、研究者の洞察力や解釈の重要性が高まっていく。以下に、内容分析の特徴と利点をいくつか挙げる。

  1. 柔軟性と豊かなデータ:
    内容分析は、多様な質的データに適用できる柔軟な手法である。テキストデータだけでなく、視覚素材や音声データなどさまざまな形式のデータを分析することができる。また、参加者の言葉や表現を直接反映したデータを使用するため、リッチな情報を得ることができる。
  2. テーマやパターンの発見:
    内容分析によって、研究質問や目的に関連するテーマやパターンを発見することができる。データから特定のトピックや問題が浮かび上がり、それらをより深く理解するための洞察を得ることができる。
  3. 多様な研究領域への適用:
    内容分析はさまざまな研究領域で利用されている。社会科学、人文科学、教育、組織研究など、さまざまな分野でデータの分析に使用される。
  4. 理論構築と仮説生成:
    内容分析は、既存の理論や枠組みの検証だけでなく、新たな理論の構築や仮説の生成にも役立つ。データから導かれたパターンやテーマを通じて、新しい洞察や理論的な示唆を得ることができる。
  5. 複数のデータソースの統合:
    内容分析は、複数のデータソースを統合して分析する際にも有用である。例えば、インタビューデータと文書データを組み合わせて分析することで、より包括的な結果やパターンを把握することができる。

 内容分析は、一般的には手作業で行われるが、コンピュータ支援の方法もある。テキストマイニングや自然言語処理の技術を活用して、大規模にも分析される。

 内容分析の手法には、次のようなアプローチがある。

  1. インダクティブアプローチ:
    インダクティブアプローチでは、データを事前の仮説や予定されたコードブックに基づいて分析するのではなく、データ自体からテーマやパターンを抽出する。研究者は、データを繰り返し読み込み、重要なアイデアやトピックを特定し、それらをテーマとしてグループ化することで、データから意味を引き出す。
  2. デダクティブアプローチ:
    デダクティブアプローチでは、事前に構築された理論的枠組みやコードブックに基づいてデータを分析する。研究者は、事前に定義されたテーマやカテゴリを使用してデータをコード化し、その結果を分析する。このアプローチでは、既存の理論や仮説を検証したり、予め定義されたテーマに関連するデータを特定することができる。
  3. ミックスドメソッドアプローチ:
    ミックスドメソッドアプローチでは、質的データと定量的データを組み合わせて分析する。内容分析においては、質的データからテーマやパターンを抽出し、それらを定量的に分析することがある。例えば、テーマの出現頻度や関連性を定量化することで、パターンの傾向や関連をより具体的に理解することができる。
  4. テーマベースの分析:
    テーマベースの分析では、事前に定義されたテーマやカテゴリに基づいてデータを分析する。テーマベースの分析では、研究者がテーマやカテゴリを明示的に定義し、データをそれらに割り当てることで分析を進めることができる。

 これらのアプローチは、研究の目的や質問に合わせて選択されうる。また、内容分析には信頼性や妥当性を確保するための手法も存在する。例えば、複数の研究者が独立してコーディングを行い、その結果を比較することで信頼性を評価する方法などがある。

内容分析の実践的応用から得られた知見

 ①コミュニケーションにおいて、内容は客観的なものではなく、送り手と受け手との関心事は異なり、特定のコミュニケーションがもたらす送り手側の期待値は受け手の時間的順序や状況によって、コミュニケーション本来の共有意図に対して、政治的な過程の理解に対しても重要な意味を持たないことが多い。

 ②内容分析の研究者は、メッセージの行間を読み解くことで、間接的にとある事象や現象の予測をしたり、推論を行える。

 ③伝えられたメッセージを解釈し、理解するためにはコミュニケーションを司る構造的なシステムモデルが必要である。

 ④メッセージが政治意図のあるような情報を提供する際に、量的な指標や統計的な分析手法を用いようとも、質的な変化を観察できるほどの結論には簡単には至らない。量的なアプローチを進めるには「シンボルの数量化」が科学的洞察の唯一の基礎であると考える。

概念的基礎

 分析対象の内容をどう考えるかという概念的基礎が重要である。

定義として、

心理、社会、政治に関するメッセージの「内容」について、

言語やその他の記号を用いたコミュニケーション・データから推論を導き出す科学的方法論であり、組み込まれた文脈に関して、再現可能で、かつ妥当な推論を行うための一つの調査技法である。

第一に、

メッセージの持つ意味は唯一ではなく、捉え方次第である。

また、

その意味は必ずしも共有されず、受け手によって異なる理解がされる。

内容分析の特徴として、

テキストの単位を概念的カテゴリーにコード化する というそれ自体がある種の推論であることが特徴である。

内容分析の要素と手順

 これまでの内容分析の要素と手順においては、

観察から入って、サンプリングを行い、データの作成、記録、変換を経て、推論を行なって、分析に入るという手順を踏む。

 方法論的な仮説において、分析後のデータ解釈を行うよりも前に、データ解釈を実践すべしという持論においては、

観察から入って、理論的サンプリングと統計的サンプリングの両方を鑑みながら、事象や現象の変数を見つけ出す作業とその構造化と時系列による確率分布を見るべきだという、意味解釈法を前面に押し出したトライアンギュレーションの方式をここでも採用すべきだと考える。

 ここでの差異は、これまでの研究における用途が、シンボリックなメッセージの文脈判断という意図を持って政治学などで使われてきたために、抽象的かつ象徴的な事象の一形態を推論して分析するという研究上の性質があったため、その手順や方式が前者の形態を取ったのは仕方のないことだと判断している。

 サンプリングにおいても、いわゆる統計的サンプリングである無作為抽出や層化抽出などの母集団形成を前提としたサンプリングではない、理論的サンプリングを前提に進めることも考慮していかないといけないと思われる。

 また、ここで重要なのは、意味解釈法の弱点とも言える、いわゆる主観性や独我論的な勝手な「解釈」をしないためのデータ解釈の方法論を、

「データ言語」

という方式を使って内容分析における意味論や統語論を論じてきたところにある。平たく言えば、分析のフォーマットを事前に作ることで、そこで生み出されるデータの解釈が再現性のある科学的な結果をもたらす演繹的推論や帰納的推論を行えるようなフォーミュレーションを持って、研究ができるということである。

内容分析から得られた「変数」の定義と活用方法

 変数とは、変動可能な一組みのあるいは二つ以上の相互排反的で、可変的な数値で表せる記号をいう。

 コミュニケーションによる事象や現象の記録単位としての変数を概念化していくことによって、個別具体的なコミュニケーションによる事象や現象が、ある種の一般化の可能性を帯びることになる。

 そこから、大事になっていくのが、

「4つの尺度基準」

である。

 尺度に対する変数の類型は以下に表されるが、

オーダーとメトリックによる変数の類型

変数の数学的な操作によって、特徴的なのは名義尺度である。
 名義尺度は順序(オーダー)も計量(メトリック)もない一組みの複数の値から成り立っている。順序尺度と合わせて、定性的と呼ばれる変数である。ある名義尺度のどの二つの値の間の差は値の全ての可能な対にとって同一であると言えるからである。逆に言えば、名義尺度以外の尺度は、

順序(オーダー)

計量(メトリック)

によって変数を識別するための概念が存在すると言える。

 オーダーの表示形態は、概念の認知的なネットワークや自然言語処理などで使われるテキストデータの意味論的ネットワークなどの順序づけられた類型がいくつか存在する。

  • グループ分け
  • 連鎖
  • 環状線
  • 立法的
  • 樹形的
  • 格子的

といったものがあり、これらがある種の連環性で表現されうるものだと考える。
 つまり、名義尺度以外の尺度基準の中で、順序を表す順位尺度には連環度を表すものが意味として含まれていることを示す。

 次に、メトリックを見ていくが、上で述べた連環性を計量的に表現するのが、順位メトリックである。順位メトリックは、「よりも」大きい、多いや、「〜の原因となる」「〜に含まれている」などの研究データの記録単位の比較の結果を表現できる変数となる。
 他のメトリックも説明しておくと、間隔メトリックは、研究データの記録単位として、距離や相似などによって記録単位間の一定の量的な差異を表現することができる間隔尺度の要素である。間隔尺度は、社会科学的な研究において、分散分析や因子分析などにおいて、間隔メトリックのある連鎖を活用することで研究では使われる。比率メトリックは、原点が存在するすべて数値で表現できる変数として比率尺度として使われる。

メトリックとそれぞれの尺度関係を表す関数

 上記の数学的な操作において、メトリックはある変数の数値が示す研究データの分析記録単位間の相違に影響を与えないように数学的操作の種類によって規定されるものである。間隔メトリックと比率メトリックの差は、間隔尺度の変数間の数字上の意味の差には順序づけがなされるということである。
 逆に、比率メトリックにおいては、順序のない変数として定義づけができるようになる。そのため、内容分析のデータ分析においては、比率尺度を用いた平均や数値間の有意性を持たせるためには、間隔メトリックが必要でもあるとも言える。

ChatGPTのような自然言語処理のAIを用いたコンピュータによる内容分析

 そもそも内容分析もコンピュータの利用による試みがなされてきていた。大量のデジタルデータを読み込むことで、計算プログラムの一意性は決定され、データの信頼性による不確実な処理は存在し得ないものとなる。
 また、統計的なデータ分析を推論を行った後で統計的検定を適用する際に用いて行ってきたこともあった。
 すなわち、データを用いて、

「1つの研究サイクル」

を意識しながら、データ解釈をすべきであるが、議事録や会議の中で、発言者がどんな主観を持って、その事象や現象を語っているかを構造化していくことが大事であり、その際に変数を上記の方法を使いながら見つけ出していくことが大事である。
 特に形式知としての表現よりも、その裏に潜んでいる暗黙知を如何に掘り出せるか、もしくはその暗黙知の存在を表現できるように分析を行うことが大事になってくる。シソーラス的な用途での分析もさることながら、文脈判断としての内容分析にフォーカスしていって、言外の意味を捉えるというデータ解釈がより重要となる。平たく言えば、形式知の表現所作はAIに任せて、

 ①特定の会話から得られるデータによって、より専門的な辞書的な意味合いなどの語用論や統語論的分析や意味論的分析の要素を持ちつつも、より探索的に発話者の発言内容を、より構造的に捉えることに特化すべきと考える。

 ②特定の会話の中で得られるデータから定式化された内容などを明示的に記述しながらも、これまた暗黙的に内在している含意の意味内容を捉えたり、実証主義的な仮説検証を行う推論を行うための論理構造(例えば、因果関係のある社会構造)を導き出すべきと考える。

 ③特定の会話の中で追加的に得られるデータに関しても、意味内容の文脈論理の中では、何度も探索的に分析の中に取り込まれるようにすべきである。

 これらは人間にしか意味解釈を行うことができないことを示していて、それ以外はむしろAIにやらせる時代がきたことを意味する。逆に内容分析という社会科学の研究領域のジャンルにおいても、この数年で進化してきたAIの活用によって、その領域はもっと拡大できるものと考える。ただし、繰り返し述べるが、どんなにAIが進化しようとも、結局のところ意味解釈の判断基準は人間に委ねられていることに違いはない。意味内容すらすべてAIがデータ解釈することになるのは人間そのものが不要になる社会を意味するが、そんな社会は今後も到来することはない。(到来したとしてもそれを意味づけして評価する人間がいないのだから意味がない)

PAGE TOP