年末記

2010年も今日で終わる。終わる前に、今年の思いは整理しておきたい。

――

今年は楽しいことも沢山あったが、何かと考えさせられ、悩まされることも多い年だった。

実は、今年は私は厄年だった。同じ生まれ年の人は同様に厄年だった。
父が最後の年とその前の年に御神籤で大凶を引いていたので、私は厄に関しては少し気にしている。

今年、私と同い年のある人が近所で亡くなったり、また別のある人が倒れたりといったこともあった。
厄年が迷信かどうかや、環境が激変したわけではない私にも言えることなのかはさておき、今年も私が生きていられたことに、感謝したい。

来年は私と同学年の多くの人が厄年なので気をつけて欲しい。初詣で厄払いを怠りなく。ただ、命にさえ関わらなければ災難は知恵をもたらしてくれるとも考えることができる。温室で育った人間は脆い。

今年もロボットサッカーの方に幾つか参加させて貰ったが、その時も災難のようなものはあった。JOの時には精神的に大分変わった人に遭遇したり、世界大会では信じられないトラブルがあったりした。だがそんなことはどうでも良いくらいに大会での出来事は楽しいことばかりだったと思う。

研究室でも特に災難は降りかかってこなかった。確かに私の常識に反する出来事は山ほどあったが、それが全てだったとは思わない。自分のいた研究室として、少しでも誇れる研究室になって欲しい一心で、自分の時間の大半を割いて可能な限り力添えさせてもらったつもりだし、自分が教えられることは教えたつもりである。

――――

今年の思いではないが、今年の大半を占めた研究に関する内容について少しだけ記そうと思う。

計算機言語学の周辺にまつわる話としては、数十年前から言語学に基づく理論やその形式化に関する取り組みがあり、一時期計算機言語処理にもそういった理論が盛んに取り入れられていた。
それが近年、コンピュータで扱える文書の量が飛躍的に増えてきたため、これを機械的に処理をする方法が提案され始めた。具体的には、ある単語が出現したときに同時に出現することが多い単語を調べたり、他の文書にはあまり出てこなくてある文書には良く出てくる単語が何であるか計算してみたり、といったことである。

機械にできる学習の手法と組み合わせることで、近年の方法では、人間が文法を規定することなしにどの単語とどの単語が繋がっているかを計算することができるようになってきた。昔の言語学の方法では、沢山ある言葉の変化のしかたとそれがもつ意味を人手で記述していたため、汎用的なものを作るのが大変だった。

近年の手法でもう一つできるようになったことは、文書の特徴や傾向を掴むことである。これは言語学のやり方との違いが明確な点でもある。これは恐ろしく単純な話で、例えばある文章に「研究」という単語が沢山出現していれば、その文章は研究に関することが書かれている可能性が高い。これを頻出単語トップ3とかで見たときに、例えば「研究」「言語」「機械」とかが出てくれば、それらの単語に代表されるような事が書かれているんだろうな、となる。これを他の文章に対しても同じことをして、一番近い頻出単語を持っている文章同士は似たようなことが書かれている文章だと判断できる。勿論、文章の内容が頻出単語の何について述べているか、そこまで詳しくは拾えない。ところが、用途によってはこれで十分といえる分野があるのも事実だった。

上記の方法は文章を、文法を無視して単語の集まりとしてしか捉えていないことからbag-of-wordsと呼ばれる。最近ではこれを発展させて、上述の、「どの単語とどの単語が繋がっているか」と機械学習を組み合わせて、どのような意味のときどのような単語の繋がりがあるかを学習するような方法が提案された。これによってできるようになったことは例えば、「~は良いと思います」と書かれていたらポジティブで、「~は良いと言えるか微妙」と書かれていたら若干ネガティブだ、といった判断が出来るようになる。単語の集まりとして文章を捉えていたら、どちらにも「良い」と書かれているからポジティブだ、となるかも知れない。

どのように単語が繋がっていたらどのような意味があるかを学習するという方法は、過去に言語学者が手作業で作っていた文法を、自動的に生成できるようにしている状況に近いのではないかと私は思っている。

ここまで述べた手法のうち機械的手法の方は、基本的に異なることが書かれた複数の文章を分類することに使える手法である。

ここで本題に入るが、私の興味のあることは、極めて近い物事を述べた複数の文章の違いを調べることであった。そもそも極めて近い複数の文書同士で比較して何になるのか、と言う人もいると思う。

世の中、完全に異なる文章ばかりではない。むしろ似たようなことが何度も述べられていることが多い。私自身も、ブログ全体の中で似たようなことを何度も記していると思うし、政治家達の討論はまさに似たようなことのオンパレードだ。過去の人が言ったようなことや、やったようなことを、多くの人が何度も繰り返している。

人間は、既に知っていることは無意識に聞き流すことができるが、そうして得られた人間の知識は、それまでに聞いたことをまとめた要約のようなものではないか。ならその聞き流しが機械的にできたら、機械も同様に知識を持てるのではないか。こういったことを、私は考えた。以前持っていた、人間同様のAIに何が必要か、という考え方から比べれば随分簡略化されてはいるものの、これでもまだ話は鋭くない。

そこで卒業研究としては、様々な会社が綴る新聞記事について、意味を考慮した要約を作成することとした。
各新聞社が同じ事件を取り扱った記事を書いていることは良くあることだが、一般的には、それら数十社以上に及ぶ記事を全て読み比べている人などいない。そんなに詳しく知る必要もないと言われれば現時点ではそれまでだが、要約ができれば人手だけではできない斜め読みができることになる。

(予想以上に長くなったのでここで一度打ち切るが、ここに追記するかも知れない)

――――以下読むことはあまりお勧めしません――――

今年は私に影響を与えた物事が大きく分けて6つあった。

1つ目は、2月19日頃にあった事。突然私のあら探しをしてきて全て否定された出来事だった。意味が分からなかった。相手の勘違いも多かったが正すことはできそうになかった。その時の現象全ての理由を考えるために、今年は随分多くの時間を費やし、仲間にも迷惑を掛けた。ただし、結局何が言いたかったのかはわからなかった。
2つ目は、研究生活。世の中にどのようなものがあり、自分が何に興味があるのかが去年までよりずっと明らかになった。
3つ目は、研究室。3年までには気付かなかった、自分と他の多くの人の意識や考え方、経験の違いがはっきりとわかった。
4つ目は、ロボカップでの経験。
5つ目は、研究室外で私がこの学校で唯一それなりに怒りの感情を抱いた人。
6つ目は、先輩含むバイト仲間との語らい。
7つ目は、院試。

そして今年特に強く意識したり考えたりするようになったことには次のようなことがある。

1つ、私は世の中の悪い点ばかり見るようになってしまっていないだろうか。それとも、本当に身の回りに悪い点が多くあるのだろうか。そして、前者か後者かを自分自身で正確に判断できるのだろうか。
2つ、私は『世の中に「仮想敵」を作ることで、それに対する敵対精神を自らの行動力とする人』になってしまっていないだろうか。つまり、本当はあまり大した欠点を持っていない人や集団を、些細な欠点を見つけては嫌悪感を抱いてそれを堂々と掲げることで自分の生きる自信にしていないか。
3つ、私は自分が辛い状況に追い込まれたとき、他人が同じ状況にならないことを普通でないことだと錯覚していないか。
4つ、私は自分の状況を、視点を変えて見たときに相手の状況に読み替えられる部分が多いことを意識できているだろうか。
5つ、私は自分にとっての常識から外れた物事を受け入れることができなくなっていないか。つまり自分の常識そのものを改変できなくなっていないか。頑固になっていないか。
6つ、私は人の意見をそのままでは受け入れることはできない傾向がでてきた。客観的指標が必要になってきた。意見を鵜呑みにするのも良いこととは言い切れないが、飲み込みが悪いのも良いことではないはずだ。

7つ、工学部の学生間で、適当に話をするときに物作りの話があまり通じず、アニメ・ゲームの話題ばかりに偏るのがおかしいと思う私の考え方は偏見であり正されるべきものだろうか。
8つ、先輩方はまだ幾らか恥を理解し、ゲームをするときは研究室から離れてするが、堂々と研究室でゲームやその話で盛り上がる人が現4年に多いことがおかしいと思う私の考え方は同じく正されるべきものだろうか。
9つ、上で述べた意見を受けた人には、私がアニメ・ゲーム含む娯楽に興じることそのものは否定していないことはまず伝わらない。よって私は誤解を怖れ一切の口出しはできない。

10、相手のある能力を計れるのは、自分に同じ種類の能力が相手以上にある時だけである。そうでない人が能力の大小を計ると、読み誤る。自分より相手が上の時は、上だということが曖昧にわかるのみである。
11、自分と同様に、この辺りの年齢から、他人にも自分の意見がそのままでは受け入れられなくなる。相手が確実に信じられる指標が必要になる。(だからここでの主張ももはや大して伝わらない)
12、私も人のことは言えないが、大学卒業間近にして、小学生並みの精神年齢で平然としている人間が山ほどいる。絶対謝らない人や、周りが見えない人や、完全受動態の人など。

You may also like...

コメントを残す

メールアドレスが公開されることはありません。