阿部和也の人生のまとめブログ

私(阿部和也)がこれまで学んだとこ、考えたことなどをまとめていきます。読んだ本や記事をきっかけにしていることが多いのですが、読書日記ではありません。

2019年11月

ヒトが言葉を発明するまでは、声、表情、動作などで直接コミュニケートするか、絵で間接的にコミュニケートしていたのだろう。その場合のピラミッドは層構造が不完全だったかもしれないが、声や絵などで「概念」を伝えていた可能性は高いので、ピラミッドは徐々に構造化されていったのだろうと考えられる。

その後、言葉が発明され、ピラミッドの構造は確立された。コミュニケーションには、感情などの最下層の情報を伝える従来の方法に加えて、アイコンやシンボルを伝える言語コミュニケーションが加わった。言葉は音声として伝えられるので最下層を通ることになるが、言語化されたアイコンやシンボルは、相手がその言葉を話し手と同じ程度に理解するなら、アイコンやシンボルを直接伝えることにほぼ相当する。ただし、音声には感情など別の要素も相乗りすることになるので、意図しないシンボルなども伝わってしまうかもしれない。

文字が発明されると、アイコンやシンボルの伝達はより確実におこなえるようになった。文字も視覚を通してやりとりされるので、経路としてはピラミッドの底辺を通ることになる。また手書き文字には感情や体調などが現れ、文章にも同様に感情などが現れるものなので、シンボル化されたもの以外にも伝わる情報があるのだが、基本的に文字はシンボルをやり取りするチャンネルだと言える。文字によるコミュニケーションをおこなう場合、指標や類像も象徴化されてコミュニケーションに載せられる。

近年になって、コミュニケーションに載せられるものが増加した。現在では音、映像、文字の他に、端末の位置、速度・加速度、持ち主の脈拍などの生体情報といったものが通信されている。また、通信の方式(モダリティ)も増加した。直接の対面、電話、テレビ、ラジオ、印刷物以外にスマートフォンやパソコンを使ったテレビ電話、SNS、VR(仮想現実)などIT技術を使ったさまざまな情報伝達法が生まれている。マウスによる操作やタッチスクリーンに触れる、あるいはスマートフォンが振動するというのも情報伝達法の一種だ。そして各モダリティは伝達できるものと伝達のしかたに特徴がある。

たとえばSNSは文字による伝達だが、文字以外にも「伝達されてしまうもの」があり、それに配慮する特別なスキルが必要になることがある。そのスキルを身につけないと「炎上」を引き起こす可能性がある。「炎上」はSNSの性質に根ざした現象だ。

チャットやメールも文字によるコミュニケーションだが、対面の会話と違い、表情や声のトーンを意識する必要がない。決まり文句で済ませることもできる。そこで実際に対面して会話することを嫌い、メールやチャットを好む人が出現する。

つまり、すべてのコミュニケーションはピラミッドの底辺を通るのだが、そこにはいわば多数の「コンセント」があり、それらのコンセントは上層と強く結びついている。私たちはそのコンセントを使ってメディアと接続している。

コンピュータもそのようにメディア(主にインターネット)と接続している。ポート番号がコンセントに相当する。私が手に持っているスマートフォンは、タッチスクリーンやイヤフォン・マイクを経由して私と直接接続しているがスマートフォンがスマートフォンとして機能するにはインターネットとの接続が不可欠である。それなら手の中のスマートフォンもタッチというメディアに接続している下のピラミッドの一部とみなせる。

現代社会の個人は、メディア生活において、それぞれがアカウントを持ち、それを通してWWW(ワールド・ワイド・ウェブ)のようなネットワークの中に位置付けられて相互に結びついています。ぼくはそこで、人間とコンピュータ、それぞれの「記号の正逆ピラミッド」が紡錘形のようなかたちになって、相互リンクによって結びついていると考えます。つまり、現代のメディアは、記号過程と情報処理の双対的プロセスとしてネットワーク化されて成立している。みんながiPadやスマホを端末として、身体も心もWWWで相互に結びついている今日のコミュニケーション状況を思い浮かべてください。(236ページ)

このような整理のしかたも興味深いが、下のピラミッドは実はひとつのものだということに注意しなければならない。ヒトは生物としての個体を分けることができるが、下のピラミッドが表すデジタルワールドは分割することに意味がない。石田の整理も面白いが、その整理のしかたの必然性は何かという検討が必要で、その整理法から何が生まれるかが重要だろう。

石田は「第1の追伸 文字学ついて」で記号のピラミッドに実際のピラミッドを重ね、ヘーゲルとフロイトを論じている(361ページ以降)。ここまでくると、「お話として聞いておきましょう」というしかなくなる。

石田は記号のピラミッドの下面に接して「記号の逆ピラミッド」を導入する。
Pyramid-p232
図3 記号の正逆ピラミッド(232ページ、図7として267ページに再掲されている)

デジタル世界では、到着したデータはアナログデータとして取得されるが、デジタル化されたうえでプログラムによって処理される。そのようすを下のピラミッドは表す。石田は次のように述べる。

ぼくが今回提起したいのは、[人間は]現在のIT化したコミュニケーション状況では、メディア装置を通してネットワークに接続されて集団に結びついているという問題です。(231ページ)

上のピラミッドの各層と下のピラミッドの各層は密に関連している。

現在のメディア・テクノロジーは、ますます身体の部分でヒトと接触するようになってきている。インターフェイスは、リアルタイムになり、インタラクティブになり、タッチパネルのように接触型になり、VRのように身体全体が没入し……というように、すべてが身体に、あるいは、身体で伝わるようにどんどん変わってきています。
そして、他方、センシング技術の発達によって、あらゆる人間の活動の痕跡は、リアルタイムで丸取りされてデータ化され、人間の生活世界はすべてがデータになるような環境になってきています。(231ページから232ページ)

彼の指摘は正しいし、問題意識も非常に面白い。だが彼の議論すべてに納得するわけにはいかない。

まず、下のピラミッドの構造には、コンピュータに関わっている人ならみな疑問を持つのではないだろうか。たしかにデータはアナログデータとして取り込まれ、デジタル変換されて処理されることが多い。だが、アナログデータの取得方法はさまざまで、一括りにできるものではない。またそれをデジタル変換する処理も、ある意味でプログラムである。また、ウェブ上での発信などでヒトが直接デジタルデータを発信する場合もある。上の三角形の最下層があらゆる刺激(原情報)を表し、知覚された刺激も知覚されなかった刺激も含んでいるように、デジタル処理系のピラミッドの底辺(この図では最上層にあたる)は、すべてのアナログデータおよびそれが前処理としてデジタル化されたものと、直接取り込まれたデジタルデータとを併せたものであるべきだろう。

そのような(デジタルの)粗情報(とここでは呼ぼう)は解釈され、ノイズを除去されてテキスト、画像、音声などと意味付けされ、場合によって保存される。この段階が第2層に当たり、上のピラミッドでは「類像」化されたことになる。さらに意味付けされた(アイコンを付与された)データは、他のデータや過去のデータと比較され、分析される。この段階は機械学習や機械推論などが活躍する段階で、これが第3層(この図では下のピラミッドの先端)になる。データは層を下るにしたがって抽象化され、粗情報の成分は減少し、分析によって付加されたデータの方が多くなる。最終的には分析によって生成された情報が主体となり、粗情報は付随情報となる。

石田流の分類も可能であるが、彼の議論を読んでいても分類の必然性が読み取れない。データの流れを上のピラミッドに相応するように「自然に」分類すれば、今述べたようになるはずだ。

石田は記号論の立場から「メディアとは記号をやりとりするコミュニケーション(233ページ)」ととらえて分析している。その場合、メディア・テクノロジーは「文字や絵や図という記号をやりとりする段階から、フォノグラフや映画などの音響や映像によるアナログメディア記号、あるいは触覚を含めた接触の経験そのものをVRのようにやりとりする段階にまで進化」したと評価できる(233ページ)。

そのような現代社会では、ヒトに伝えられた情報がどう処理(認識)されるのかという「記号過程(セミオーシス)」と、コンピュータに伝えられた情報がどう処理されるのかが問題となり、さらに情報(刺激)がヒトやコンピュータという処理系にどう取り込まれるのかという「記号接地問題」が生じるという石田の説明も理解できる。

石田は図の菱形の処理過程を各個人のものとしている。私はその点が理解できない。上のピラミッドは個人のものだが、下のピラミッドはすべての情報処理系を束ねたものと私は考えている。そうでなければ、個人の情報を収集し、分類したり格付けしたりしている現代社会の情報系を位置付ける場所がなくなってしまう。

長くなったので、この続きは次回にしたい。

この本の題名は『記号論』だが、日本語の記号に当たる英語にはsymbol(シンボル、象徴)とsign(サイン、印)の2つがあることに、石田の指摘により初めて気づかされた。少し長いが、その指摘を引用する。

情報科学では、日本語で「記号」とか「記号主義」とか言う場合、対応する英語はsymbolあるいはsymbolismですね。情報科学だけでなく「記号論理学」と言うときにも、もとの言葉はsymbolic logicです。これには19世紀以降の論理学の形式化の歴史が絡んでいるのですが、こうした場合に使用されている「記号symbol」は、論理式や数式のような人工記号をまず指しています。自然言語を扱うにしても、論理主義的な観点から扱われる。[中略]
それに対して、記号論の言う「記号」は、17世紀の[ジョン・]ロックによるセメイオティケー(記号論)*以来、英語ではサイン(sign)です。ここで話しているパース[引用者注:パースについては後に説明する]の記号論はその系譜で、パースの立場から言うと、シンボルは、記号のなかのあくまでもひとつのあり方で、その成り立ちが約定的で法則化されているものという定義になります。だからそれは、記号論では、記号ではなく「象徴」と訳されています。これは日本語の訳語の問題で、英語が混乱しているわけではありません。情報科学の言うsymbolはパースのsymbolそのものです。ただそれが、日本語では別々に訳されてしまっているわけですね。(265ページ)

チャールズ・パースは19世紀末から20世紀初頭にかけて活躍した米国の哲学者で、プラグマティズムの創始者であるとともに、論理を0(偽)と1(真)で表すことを最初に考案したのだそうだ(42ページから43ページ)。

石田はパースの記号論による3分類を仏国の哲学者ブーニューが独自の解釈を加えた「記号のピラミッド」を頻用している(下図)。ピラミッドは3段になっており、最下段は「指標(インデックス)」、中段は「類像(アイコン)」、最上段の頂上は「象徴(シンボル)」となっている。いろいろな言葉が出てくるので混乱するが、私の理解したところでは、インデックスとはすべての1次情報(私たちが直接受け取る情報)を表しているようだ。その情報は特徴を抽出されて理解され、アイコン(イメージ)となる。そしてアイコンは言語化されてシンボル(文字)を使って記録され、伝達される(257ページから258ページ)。記号論理学は最上段のシンボルを扱うが、記号学はそれを含んで中段のアイコンから扱うということになる。
Pyramid-p260
図6「記号のピラミッド」の再解釈(260ページ)

私の頭の中で輪郭を欠いていた「記号」という言葉に、形を与えられそうな気がしてきた。

ジョン・ロックはギリシャ語sēmeîonから「semeiotike(セメイオティケー、記号論の意)」という言葉を造語し、記号論の必要性を提唱したのだそうだ(31ページ)。

人類は、他の類人猿から分かれた当初は自然の影響を直接受け、飢饉などに悩まされたと考えられる。その後、農耕や牧畜をおこなうようになることで、自然の影響からはずいぶんと自由になった。さらにそれから人間の社会はどんどん巨大化、複雑化し、人は身分制のような社会的束縛を受けたり、奴隷として身体的束縛を受けたりするようになった。近年では、基本的人権の確認、社会格差の是正などにより、奴隷的な扱いを受けている人はずいぶん減少し、かなりの人が社会的にも自由になった。現在の日本では、多くの人が自分は自由だと思っているのではないだろうか。

たしかに身体的な束縛はなく、原始人のように飢えることはない。(ただし、飢えについては話はそう簡単ではない。日本では経済格差が拡大し、6人に1人は貧困である。じゅうぶんな食事ができない人もかなりの数いる。現代人は採取に頼ることができないため、飢えた場合の対処法は原始時代より限られている。そういう意味で「原始人のように飢える」ことはないのだが、私たちは「現代人として飢える」のだ。)さらに、インターネットを使えば豊富な情報にアクセスできるようになった。だが、実際には情報が豊富すぎて、私たちは情報を得るのに検索に頼るしかない。つまり、検索したものは手に入るが、検索したものしか手に入らない世界にいる。

英語のfreeには「自由な」という意味と「(〜が)ない」という意味がある。ストレスフリーと言えばストレスが無いことだし、アルコールフリーのビールと言えばアルコールを含まないビールだ。米国で奴隷解放がおこなわれたとき、解放された奴隷は「二重の意味でfree」だと言われた。体は自由になったが、生産手段を持たないということだ。

今の私たちは、豊富な情報にいつでもアクセスできる。その意味では自由だ。しかし、その自由は検索エンジンによって与えられたものだ。検索エンジンが与えてくれないものを探すのは至難の業だ。偶然に頼るしかない。つまり、私たちは自前の検索手段を持たない。私たちの自由にも「二重の意味」がある。

また、私たちはインターネットを利用して検索したり買い物したりすることで情報を蓄積され、「人物像」を作成されている。その人物像は、本人のあずかり知らぬところに存在し、本人はその姿を確かめることもできない。私たちは自分の社会的人格さえコントロールできなくなっている。

さらに石田は夢の解読について触れ、それが実用化されると夢さえ社会的に支配される可能性があると訴える。

夢のデコーディングが社会に実装される可能性は非常に高い。夢を「解読する」つまり「書き取る」ことができるようになれば、夢を見させたり、人工的に書き換えるプロジェクトが当然進んでいくでしょう。夢のなかにコマーシャルを流すようなことさえ、夢ではないかもしれない。
[中略]
ハイパーコントロール社会においては、こんな夢を見たからおまえを逮捕するということだっでないとは言いきれません。(200ページ)

私たちはもうITの力なしで生きていくことはできない。だが、ITの高度利用によって生まれる社会は、物質ではなく情報を基盤とした、従来とはまったく異なる社会なのだ。自由の意味も従来とは異なってくる。石田はそのような社会には記号論が必要だと説いている。

だが、実は視覚情報の処理においても時間が関係している。

私たちの目は動く物を見る際に2つの眼球運動を使い分けている。ひとつは眼球をゆっくり動かす使い方で、動きのゆっくりしたものを見つめるときに使う。もうひとつはゆっくりの動き(緩徐相)と速い動き(急速相)を交互に繰り返す使い方で、動きの速いものを見たり、ものを詳しく見ようというときに使う。後者を衝動性眼球運動(サッケードあるいはサッカード)などと呼ぶが、衝動性眼球運動の場合、眼球が速く動いている急速相の視覚は抑制されていることがわかっている。つまり、短時間ではあるが私たちは目が見えていない。

ところが私たちはそれを意識することがない。列車の窓から看板を読む場合、私たちの目は忙しく動いている。急速相と緩徐相が繰り返されているが、私たちに知覚されるのはなめらかに流れて行く看板と、その上の文字である。その文字は決して点滅したりちらちらしたりしない。私たちの視覚も予測と補完により成り立っている。(そういえば、まばたきも自覚できないが、まばたきの瞬間も見えていないはずだ)

さらに図形の認識では、不完全な図形を見せるより、欠けた部分があることを示した図形のほうが認識しやすいことから、この予測と補完は静止画の処理においてもおこなわれていることがわかっている。

たとえば、下の左の図を見ても、何の図なのかがわからないが、マスクを表す右の図に重ねると途端に描かれているものが了解できる。(図はマウスでドラッグできる。うまくいかない場合は下のボタンを。出典 http://www.kecl.ntt.co.jp/IllusionForum/)
Damashie-LettersDamashie-Masks

映画やモニタの画像が滑らかに動くように見えることも人間の視覚処理に関係している。ヒトの目には残像が残るので、そのためにスムーズに見えると説明されることが多いが、そんなに簡単なことではない。ストップモーション・アニメーションという技法があり、YouTubeにも数え切れないほど作品がアップされているが(たとえばhttps://youtu.be/x8RywSoWh9A)、人形や折り紙、粘土細工などを少しずつ形を変えながら撮影し、その画像を映画として連続して流すことで動きを見せるものだ。だが、この方法では動きがスムーズさに欠ける。それがかえって味になる場合もあるが、リアルさを演出したい場合には、撮影する瞬間にカメラや被写体を少し動かし、意図的に画像にブレを作る方法がある。英語版WIkipediaには「Go motion」として紹介されており、その記事によれば「スターウォーズ帝国の逆襲」(1980)で最初に採用された(https://en.wikipedia.org/wiki/Stop_motion#Go_motion)。映画は通常1秒間に24コマの速度で映写される(実際は1コマを2回上映し48コマ/秒で上映されているとのことだ)。1コマが映写されている時間は、コマ送りの時間を除いて41ミリ秒ほどということになるが、その間にも目は1〜2箇所を見ることができる。その像がブレていることで現実感が増す。

私たちの視覚も、事後的に調整されて解釈されている。フーコーが現代に生きていたら、視覚と聴覚の両方を取り入れた理論を考え出していたかもしれない。

↑このページのトップヘ