ブログ

  • ラフ集合からThomas Mannの「魔の山」を考える5

    3 まとめ

     周知のように、ラフ集合は、表形式のデータからどのような知識を抽出できるのかを問題にする。例えば、近似の観点から見ると、対象となる概念の肯定的な側面と否定的な側面を持つ知識を抽出することに特徴がある。一方、縮約の立場から見ると、概念の肯定的な側面を表現する最小限の属性集合を求めることに特徴がある。 
     現在作成しているThomas Mannのイロニーに関するDBは、1 「計算文学入門の概要」中でも示した通り、彼のイロニー自体が物事を肯定的にも否定的にも考察することから、ラフ集合によるアプローチは面白いと考えられる。また、ラフ集合の考え方を基とするテキストマイニングについては、Thomas Mannのイロニーが読み取れるような文章を抽出しながら話を進めれば、計算文学において価値のある基礎研究となるであろう。

    花村嘉英 (2017)「ラフ集合でThomas Mannの「魔の山」を考える-テキストマイニングのトレーニング」より

  • ラフ集合からThomas Mannの「魔の山」を考える4

    2.2 縮約

     データからパターンを抽出する際、最も簡単なルールを求めたい。ラフ集合の場合は、下近似の部分集合がルールを与えることから、属性の集合を満たす集合により下近似の部分集合を与え、属性数が最小のものを求めることによりルールが生成される。
     前節は、属性が一つの場合を扱ったが、実際に下近似を生成するには、複数の[属性=値]の連言による分割を考える必要がある。例えば、症状と喫煙の連言を考えてみよう。{{1},{2},{3,4},{5,6}}という分割が生成され、クラスの分割に一致した下近似と上近似が求められる。
     必要最小限の属性のみを抽出することは、簡略化と呼ばれる。また、ラベルの下近似を与える最小限の属性集合は、縮約と呼ばれる。{症状と喫煙}は、縮約の一例となる。最小限の[属性=値]の対を持つ規則は、必要最小限の属性数を持つ縮約から求めることができる。例えば、表1の場合、{症状と喫煙}という縮約から、以下のルールを求めることができる。

    (3)[症状=重い(慢性)]⇒[クラス=長い]、[症状=重い(急性)]⇒[クラス=短い]、[症状=軽い]∧[喫煙=しない]⇒[クラス=中位]、[症状=軽い]∧[喫煙=する]⇒[クラス=長い]

     次に、[クラス=中位]を満たす集合{1}について考えてみよう。この{1}が、他のクラスを満たす集合{2},{3,4},{5,6}から特定できるような属性の集合を求める。レコード1と属性年代により特定できないレコードの集合を[1]年代と表記すると、属性年代、性別、病名、症状、喫煙に対して、以下のことが定義できる。

    (4)
    [1]年代=[1,2,3]
    [1]性別=[1,5] [1]病名=[1,2,5] [1]症状=[1,2]
    [1]喫煙=[1,3,4,5,6]

    {1}の部分集合となるものは存在しないので、一つの属性だけで[クラス=中位]を分類することができる情報はない。そこで、これらの属性間の連言を考えてみる。[年代=20-29]∧[性別=女]を満たす集合は、[1]年代∩[1]性別として表記される。この場合、縮約の候補は、以下のようになる。

    (5)
    [1]性別∩[1]症状=[1]
    [1]症状∩[1]喫煙=[1]

    {性別,症状}、{症状,喫煙}あたりが候補となりそうだ。{2},{3,4},{5,6}についてもこの方法を適用すると、{症状,喫煙}が縮約となることがわかる。ここまでが、属性数2の縮約である。
    次に、属性が3つある縮約を求めてみよう。これまでの議論からわかるように、この縮約は、属性数3となる候補のうち{性別,症状}を包含する属性の集合から生成される。この場合は、{1}ではなく{2},{3,4},{5,6}に関して計算しなければならない。例えば、

    (6)
    [2]性別∩[2]症状=[2]
    [3]性別∩[3]症状=[3,4]
    [4]性別∩[4]症状=[3,4]
    [5]性別∩[5]症状=[5]
    [6]性別∩[6]症状=[6]

    となるので、3番目のレコードに着目すれば、

    (7)
    [3]性別∩[3]症状∩[3]年代=[3]
    [3]性別∩[3]症状∩[3]病名=[3,4]
    [3]性別∩[3]症状∩[3]喫煙=[3,4]

    が得られる。{性別,症状、喫煙}は、{症状,喫煙}を部分集合として含むので、{性別,症状、年代}、{性別,症状、病名}が縮約となる。同様にして、4番目のレコードに着目すれば、

    (8)
    [4]性別∩[4]症状∩[4]
    年代=[4] [4]性別∩[4]症状∩[4]病名=[3,4]
    [4]性別∩[4]症状∩[4]喫煙=[3,4]

    が得られ、3番目のレコードと同じ結果となる。以上のことから 表1のクラスに関する縮約は、{症状,喫煙}、{性別,症状,年代}、{性別,症状、病名}となる。 ここまで述べてきた計算方法は、一つずつ属性を追加していくことにより縮約にたどりつくボトムアップ型であるが、ラフ集合にはこれとは別に、決定ルールから出発するトップダウン型の計算方法がある。例えば、1番目のレコードは、次のような形式によって記述される。

    (8)[年代=20-29]∧[性別=女]∧[病名=持病]∧[症状=軽い]∧[喫煙=しない]⇒[クラス=中位]

    これらの属性のうち何が削除されると矛盾が生じるだろうか。例えば、症状と喫煙を削除すると、次のような二つの決定ルールが生成される。

    (9)a [年代=20-29]∧[性別=女]∧[病名=持病]⇒[クラス=中位]
    (9)b [年代=20-29]∧[性別=女]∧[病名=持病]⇒[クラス=短い]

     ラフ集合では、このことを矛盾が発生したと言う。つまり、{症状,喫煙}は、ルールの記述になくてはならない属性の集合を与えている。この手続きを残りの{2,3,4,5,6}に関しても適用すると、最終的に、{症状,喫煙}、{性別,症状,年代}、{性別,症状、病名}が表1の分類に不可欠な属性の集合となり、これらが縮約となる。

    花村嘉英 (2017)「ラフ集合でThomas Mannの「魔の山」を考える-テキストマイニングのトレーニング」より

  • ラフ集合からThomas Mannの「魔の山」を考える3

    2 ラフ集合

     津本(2001)に基づき平易なラフ集合の考え方を紹介する。津本論文は、データベース(DB)の中にある集合体の近似的な表現とそれに必要な最小限の属性集合(縮約と呼ばれる)の求め方を説明している。

    2.1 近似

     「魔の山」の登場人物が患っている病気の症状(表1)について考えてみる。

    表1 登場人物の病気の症状
    No. (名前または
    ニックネーム)     年代   性別  病名     症状     喫煙  クラス(療養所の滞在期間)
    1.
    Claudia Chauchat   20-29  女   持病    軽い(慢性)  なし    中位
    2.
    Hans Castorp     20-29  男  持病(カタル) 軽い(慢性) あり    長い
    3.
    Joachim Ziemßen   20-29  男  発熱(肺痛) 重い(慢性)  なし   長い
    4.
    爪を噛む青年     10-19   男   発熱      重い(慢性) なし    長い
    5.
    Barbara Hujus     20-29  女   持病     重い(急性) なし    短い
    6.
    Tou-les-deuxの長男   10-19  男  チフス    重い(急性)  なし    短い

     この表は、1から6までのレコードを持っている。そして、内容は、属性の集合{年代、性別、病名、症状、喫煙}と所属クラス(サナトリウムの滞在期間)である。それぞれ属性には、値の集合がある。例えば、病名に関して大きく分類すると、{持病、発熱、チフス}がそれに当たる。

     周知のように、ラフ集合は、各属性がデータの集合{1,2,3,4,5,6}の分割を与えるところに原点がある。[病名=持病]、[病名=発熱]、[病名=チフス]を満たすデータの部分集合は、{1,2,5}、{3,4}、{6}である。表1は、他の属性についても同様の分割を与えている。次に、レコードのラベル付けを考える。ここでは、クラスをそのラベルと仮定する。[クラス=中位]に注目すると、これを満たすデータは、{1}である。これらをまとめると、表2となる。

    表2 分割の例
    病名による分割  クラスによる分割
    持病 {1,2,5}    短い {5,6}
    発熱 {3,4}     中位 {1}
    チフス{6}     長い {2,3,4,}

    病名による分割とクラスによる分割から何が言えるであろうか。一番簡単なことは、[病名=チフス]を満たす分割が、[クラス=短い]を満たす分割の部分集合となっていることである。古典論理によれば、こうした関係は、次のように表記される。

    (1)[病名=チフス]⇒[クラス=短い]

    ラフ集合では、[病名=チフス]を満たす分割を[クラス=短い]の下近似と呼ぶ。[病名=チフス]を満たせば、クラスは短いが確定するためである。 次に、[クラス=短い]のすべてをカバーする分割について考えてみよう。上述の例では、[病名=持病]を満たす集合と[病名=チフス]を満たす集合の和集合が{1,2,5,6}となり、[クラス=短い]を部分集合とすることができる。これらの集合間の関係は、古典論理を用いると、次のように表すことができる。ラフ集合では、これらの病名に関するデータの分割をそれぞれのクラスの上近似と呼ぶ。

    (2)[クラス=短い]⇒[病名=持病]∨[病名=チフス]

    この結果、[クラス=短い]の下近似は、[病名=チフス]を満たす集合、上近似は、[病名=持病]または[病名=チフス]を満たす集合で与えられる。これらの関係は、表3にまとめられる。

    表3 病名よる上近似と下近似
    クラス 分割 上近似 下近似
    短い {5,6} {6} {1,2,5,6}
    中位 {1}   { } {1,2,5}
    長い {2,3,4} { } {1,2,3,4,5}

    ラフ集合は、近似の質をcard(下近似)/card(上近似)により定義する。例えば、[クラス=短い]の場合、近似の質は、1/4 =0.25である。一方、症状であれば、表4のような近似が得られる。

    表4 症状よる上近似と下近似
    クラス 分割  上近似 下近似
    短い {5,6}  {6} {1,2,5,6}
    中位 {1}    { } {1,2,5}
    長い {2,3,4}  { } {1,2,3,4,5}

    この表から分かるように、例えば、[クラス=短い]の場合、近似の質は、2/2 =1.0である。
    ラフ集合では、各属性がデータ集合の分割を構成し、その分割によってクラスや決定属性といったデータのラベルと属性との関係について、近似とその質が測定されていく。その際、ラベルを上近似と下近似で押さえるということが、ラフ集合の特徴として上げられる。

    花村嘉英 (2017)「ラフ集合でThomas Mannの「魔の山」を考える-テキストマイニングのトレーニング」より

  • ラフ集合からThomas Mannの「魔の山」を考える2

    1 「計算文学入門」の概要

     本書は、タイトルにもあるように計算文学の入門編という位置づけである。計算文学は、人文科学と情報科学によるシナジー効果を探るための研究分野の一つと言える。しかし、闇雲に勉強したところで、マージなどできるはずがない。まず、スタートラインに立つために、ポイントとなる組み合わせを探る必要がある。周知のように、人間とコンピュータの間にロジックを立てることは標準となっており、「Thomas Mannはファジーネス」といった組み合わせを見つけることができれば、仮に既に亡くなってしまった作家の分析をコンピュータ上で行う場合でも、結合や比較といった単体的な処理ではなく、マージのための方向性を規定することができる。無論、言語系のロジックは、システム系と仕組みが異なるため緩衝材が必要となる。

     Thomas MannのイロニーとZadehのファジー理論は、それぞれ次のように定義されている。

    Baumgart(1964:22)によるThomas Mannの「イロニー」の定義。
    ”Als die Bedingung seines Prosas hält Thomas Mann immer die Distanz zur Wirklichkeit, einmal um sie so genau wie möglich zu betrachten, einmal sie zu kritisieren, das heißt ironisch. …Die kritische Distanz könnte zu einer ironischen Distanz werden. Tatsächlich ist der kritischen Prägnanz eine Art Grenze gesetzt, die aus der Beschaffenheit des sprachlichen Medium selbst dem Bedürfnis nach einer restlos präzisierten Begriffssprache entgegenwirkt.”
    「Thomas Mannは、散文の条件として常に現実から距離をとる。一つには、現実をできるだけ正確に考察するために、また一つには、それを批判するために、つまり、イロニー的に。・・・この批判的な距離は、イロニー的な距離となるであろう。実際、批判的な表現上の簡潔さには、余すところなく正確に規定された概念言語の要求に対して、言語媒体そのものの特徴から反対の行動をとるある種の制限が設けられている。」

     Yager et al(1987: 23)によるZadehの「ファジー理論」の定義。
    ”There is an incompatibility between precision and complexity. As the complexity of a system increases, our ability to make precise and yet non-trivial assertions about its behavior diminishes. For example, it is very difficult to prove a theorem about the behavior of an economic system that is of relevance to real-world economics.”
    「正確さと複雑さは、両立が困難である。システムの複雑さが増すと、その振舞いについて正確ではっきりとした主張はできなくなってくる。例えば、現実の経済と関連したシステムの振舞いを推測することは、大変に難しい。」

     双方の定義間にあるギャップを埋めるために、言語系とシステム系の論理をつなぐ緩衝材として論理文法を使用する。(詳細については、「計算文学入門」の第2章「論理文法の基礎」を参照すること。) 論理文法は、小史を兼ねてHPSG(Head Driven Phrase Structure Grammar)、Montague Grammar、DRT(Discourse Representation Theory)、直感主義の論理などを経てファジー理論へと進んで行く。その際、Richard Montague による言語分析(PTQ)とThomas Mannの「魔の山」をマージすることにより、何か異質のもの(ここではファジー推論)を引き出せるかどうかがポイントとなる。つまり、Thomas Mannのイロニーを形式論によって記述する場合、ファジー推論を選択することが現状ではベストであるという結論を探っていく。
    「魔の山」からの分析は、上述したイロニー的な距離が問題となる。特に、主人公のHans CastorpとChaucha夫人との距離、さらに、ダボスの療養所に勤務する医者のDr. Krokowski(Behrens院長の助手)を仲介としたHans Castorpと甥のJoachim Ziemßen との距離が問題となっている。距離を測定するために、ファジー化、ファジー推論および脱ファジー化という技法が使われる。また、推論の基礎をなす記憶についても言及がある。(詳細については、「計算文学入門」の第3章「やさしい曖昧な数学」を参照すること。)

    花村嘉英 (2017)「ラフ集合でThomas Mannの「魔の山」を考える-テキストマイニングのトレーニング」より

  • ラフ集合からThomas Mannの「魔の山」を考える1

    0 はじめに

     Thomas Mann(1875-1955)の「魔の山」(Der Zauberberg)は、1924年、Fischer Verlagから出版され、評論、翻訳、テキスト言語学、映画といった主に文系の分野で研究がなされてきた。しかし、ここでは、この作品を計算文学というシナジーの領域で考察していく。出発点は、「計算文学入門」の中で説明したThomas Mannのイロニーとファジー推論の整合性の良さである。それをベースにスイスのダボスにあるサナトリウムの患者について表形式のデータを作成し、その一部を平易なラフ集合の概念に基づいて分析していく。「計算文学入門」は、記号論理を用いてThomas Mann のイロニーを分析しているが、 Zadeh自身がシステム系のファジー理論を言語系にアレンジしたように、本稿では、ラフ集合を言語系にアレンジしながらデータを処理していくため、テキストマイニングのトレーニングとしての位置づけもある。

    花村嘉英 (2017)「ラフ集合でThomas Mannの「魔の山」を考える-テキストマイニングのトレーニング」より

  • Thomas Mannの「魔の山」のデータベース化と推定からの分析7

    7 まとめ

     「魔の山」のデータベースの作り方と統計処理の推定による分析例を説明した。論理計算によるトーマス・マンとファジィというシナジーのメタファーを支えるために、データベースを作成し、実験を重ねてさらに客観性を上げていくつもりである。
     問題解決の場面には、作家の執筆脳に関する情報が見え隠れしているため、さらに他のカラムと調節しながら、考察を続けていきたい。

    【参考文献】
    花村嘉英 計算文学入門-Thomas Mannのイロニーはファジィ推論といえるのか? 新風舎 2005
    花村嘉英 从认知语言学的角度浅析鲁迅作品-魯迅をシナジーで読む 華東理工大学出版社 2015
    花村嘉英 森鴎外の「山椒大夫」のDB化とその分析 中国日语教学研究会江苏分会 2015
    花村嘉英 森鴎外の「佐橋甚五郎」のデータベースとバラツキによる分析 中国日语教学研究会江苏分会 2016
    花村嘉英 日本語教育のためのプログラム-中国語話者向けの教授法から森鴎外のデータベースまで 南京東南大学出版社 2017
    Mann, Thomas: Der Zauberberg, Frankfurt a. M., Fischer 1986
    日本成人病予防協会監修:健康管理士一般指導員通信講座テキスト 2014
    佐々木隆宏 流れるようにわかる統計学 東京:KADOKAWA 2017

    花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定からの分析」より

  • Thomas Mannの「魔の山」のデータベース化と推定からの分析6

    6 推定によるデータベースの分析

     「魔の山」のデータベースの中で、特に問題解決の場面が考察の対象となる。その中で問題解決の場面の比率は0.2とする。母集団から標本を抽出するとき、ファジィという論理計算の結果を基にして、信頼度を95%とするには、誤差を0.09以下にするのに標本はおよそいくつ必要になるのであろうか。
     標本の大きさをnとすると、標本平均と母平均との差の絶対値は95%の確立で、
    1.96√0.2(1-0.2)/n 以下であるから、1.96√0.2(1-0.2)/n≦0.09 であればよい。それゆえに、
    n≧76.1・・・。よって、n≧77とすればよい。
     但し、小説の構成を単純に起承転結とした場合、起承の部分には問題解決の場面が比較的少ないため、分析の対象を増やすことにより数字の調節ができると考えている。例えば、「魔の山」のデータベースから無作為に1000ラインの幅でデータを選んだ場合、比率が0.2前後になることを説明できれば、上記仮定が正しいことになる。サンプル的に100ライン単位で小さな問題解決の場面も含めて数字にしてみる。

    表2 問題解決の場面数
    ライン 1から100, 100から200, 200から300, 300から400, 400から500, 500から600, 600から700, 700から800, 800から900, 900から1000, 1100から1200, 1100から1200, 1200から1300, 1300から1400, 1400から1500, 1500から1600, 1600から1700, 1700から1800, 1800から1900, 1900から2000     
    問題解決 3, 2, 10, 29, 21, 18, 22, 9, 11, 19, 40, 18, 18, 28, 25, 32, 28, 25, 47, 13
    の場面   

     理論的には、n≧77であるから、1600越えぐらいで400となればよい。現状のデータベースでは1800越えであるため多少の修正が必要である。そこで、比率を0.25にすると、n≧89.2となり、表2の数字に近くなるため、問題解決の場面の比率は、0.25ぐらいで良いであろう。

    花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定からの分析」より

  • Thomas Mannの「魔の山」のデータベース化と推定による分析5

    5 DBの作成法と分析

     DBの作成法について説明する。エクセルのデータについては、列の前半(文法1から意味5)が構文や意味の解析データ、後半(医学情報から人工知能)が理系に寄せる生成のデータである。一応、L(受容と共生)を反映している。DBの数字は、登場人物を動かしながら考えている。こうしたDBを作る場合、共生のカラムの設定が難しい。受容はそれぞれの言語ごとに構文と意味を解析し、何かの組を作ればよい。しかし、共生は作家の知的財産に基く脳の活動が問題になるため、作家ごとにカラムが変わる。執筆脳は、問題解決の場面で強くなる。(花村2015、花村2017)作成したDBの大きさは、およそ5000ラインである。 

    表1 魔の山のDBのカラム

    項目名    内容              説明
    文法1    量化         不定代名詞、相互代名詞。
    文法2    態           能動、受動、使役。
    文法3    時制、相       現在、過去、未来、進行形、完了形。
    文法4    様相         可能、推量、必然、義務など。
    文法5   イディオム       様相の拡大。
    意味1     個性         若い、背が高い、我慢強いなど。
    意味2      距離         現実的または心理的に近い、中位、遠い
    意味3     五感         視覚、聴覚、味覚、嗅覚、触覚
    意味4     振舞い         振舞い
    意味5     数字         いろいろな数字。
    医学情報  病跡学との接点     受容と共生の共有点。構文や意味の解析から得た組               「イロニーとファジィ」と病跡学でリンクを張るためにメディカル情報を入れる。
    記憶  短期、作業記憶、長期(陳述と非陳述)  作品から読み取れる記憶を拾う。長期記憶は陳述と非陳述に分類される。  
    認知プロセス1   感覚情報の捉え方  感覚器官からの情報に注目するため、対象の捉え方が問題になる。例えば、ベースとプロファイルやグループ化または条件反射。
    認知プロセス2  記憶と学習  外部からの情報を既存の知識構造に組み込む。その際、未知の情報についてはカテゴリー化する。学習につながるため。
    認知プロセス3  計画、問題解決、推論  受け取った情報は、計画を立てるときにも役に立つ。目的に応じて問題を分析し、解決策を探っていく。獲得した情報が完全でない場合、推論が必要になる。
    人工知能1 ファジィ、ニューラル 「イロニーとファジィ」が入力で、「ファジィとニューラル」が出力となる。             
    人工知能2 エキスパート リスク回避を目的とした行動に注目する。

        

    花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定による分析」より

  • Thomas Mannの「魔の山」のデータベース化と推定による分析4

    4 トーマス・マンの脳の活動はファジィ

     トーマス・マンは、散文の条件として常に現実から距離を置く。一つには、現実をできるだけ正確に考察するために、また一つには、それを批判するために、つまり、イロニー的に。この批判的な距離は、イロニー的な距離となりうるだろう。実際、批判的な表現における簡潔さには、余すところなく正確に規定された概念言語の要求に対して、言語媒体そのものの特徴から反対の行動をとるある種の制限が設定されている。
     ザデーはファジィを次のように定義する。正確さと複雑さは両立が困難である。システムの複雑さが増すと、その振舞いについて性格ではっきりとした主張は出来なくなってくる。例えば、現実の経済と関連したシステムの振舞いを推測することは、大変に難しい。
     つまり、両者とも、物事を深く正確に突き止めていってもそこには限界があり、逆に深追いしないことにより、より良い結果をもたらすことができると主張している。トーマス・マンのイロニーとファジィ理論の整合性については、著作の中ですでに実証済みである。(花村2015、花村2017)

    花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定による分析」より

  • Thomas Mannの「魔の山」のデータベース化と推定による分析3

    3 データベースを作成するフローチャート

    ① 知的財産が自分と近い作家を選択する。
    ② 場面のイメージのDBを作成する。場面が浮かぶように話をまとめる。
    ③ 解析イメージから何かの組を作る。言語解析は構文と意味が対象になる。
    ④ 認知科学のモデルは、Lのプロセス全体に適用される。例、前半は言語の分析、後半は情報の分析。
    ⑤ 場面ごとに問題の解決と未解決を確認する。
    ⑥ 問題解決の場面では、Lに縦横滑ってCに到達後、解析イメージに戻る。問題未解決の場面では、すぐに解析イメージに戻る。
    ⑦ 各分野の専門家が思い描くリスク回避を参考にしながら、作家の執筆時の脳の活動を想定する。
    ⑧ 問題解決の場面を中心にして、テキストの共生について考察する。

    ①、②、③は受容の読みのプロセス、④は認知科学の前半と後半、⑤、⑥は異質のCとのイメージ合わせになり、⑦で作家の脳の活動を探り、⑧でシナジーのメタファーに到達する。DBの作成については、これらが全て収まるようにカラムを工夫すること。

    ①  一文一文解析しながら、選択した作家の知的財産を追っていく。例えば、受容の段階で文体などの平易な読みを想定し、共生の段階で知的財産に纏わる異質のCを探る。この作業は②と③でも行われる。
    ②  場面のイメージが浮かぶような対照表を作る。
    ③  テキストの解析を何れかの組にする。例えば、トーマス・マンは「イロニーとファジィ」、魯迅は「馬虎と記憶」という組にする。組が見つからなければ、①から③のプロセスを繰り返す。
    ④  認知プロセスの前半と後半を確認する。
    ⑤  場面の情報の流れを考える。問題解決と問題未解決で場面を分ける。
    ⑥  問題解決の場面は、異質のCに到達後、解析イメージにリターンする。問題未解決の場面は、すぐに解析イメージにリターンする。こう考えると、システムがスムーズになる。
    ⑦  各分野のエキスパートが思い描くリスク回避と意志決定がテーマである。緊急着陸、救急医療、株式市場、環境問題などから生成イメージにつながるようにリスク回避のポイントを作る。そこから、作家の意思決定を考える。
    ⑧  これにより作家の脳の活動の一例といえるシナジーのメタファーが作られる。「トーマス・マンとファジィ」というシナジーのメタファーは、テキスト共生に基づいた組のアンサンブルであり、文学をマクロに考えるための方法である。

    花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定による分析」より