今日は午前中から、修士論文の “Method”セクションにおける「交差再帰定量化解析(CRQA)」について文章を執筆していた。これまで、「状態空間グリッド(SSG)」に関する “Method”セクションと “Results”セクションの執筆に従事していたが、今日からはいよいよ、二つ目の分析手法の文章の執筆に取り掛かった。
突如降り出した雨を横目に、CRQAという非線形ダイナミクスの手法に関する文章を執筆し始めた。この手法は、以前にも紹介したように、二つのシステムのシンクロナイゼーションの度合いを測定することなどに活用することができる。
つまり、二つの時系列データをもとに、それらがどれほど同じ繰り返しパターンで動いているのかを分析することができるのだ。今回の私の研究で言えば、教師の行動を一つのシステムとし、学習者の行動がもう一方のシステムとなる。
両者の行動に対して概念分類を行い、それぞれの分類に数値を割り当て、時系列データを作成した。CRQAという手法の強みは、今回の研究で取り扱うデータのように、カテゴリカルデータにも適用することができる。
また、「トレンド除去変動解析(Detrended Fluctuation Analysis:DFA)」や「標準化分散解析(Standardized Dispersion Analysis:SDA)」のような、他の手法と異なり、大量のデータが必要になるわけではない。
今回は、各クラスにおける教師と学習者の行動がどれほどシンクロナイゼーションを起こしているのかを調査していく。実際のところ、各クラスの二つの時系列データが持つデータポイントは、平均で50個ほどである。
この数であれば、DFAやSDAを用いてしまうと——CRQAと用途が全く異なるが——、その結果がそれほど信頼できないものになってしまう可能性が高い、と非線形ダイナミクスの専門家であるラルフ・コックス教授から以前に話を聞いていた。
しかし、CRQAであれば、50個のデータポイントに対しても、十分にそれを活用することができる。以前の学期に履修していた「複雑性と人間発達」のコースの実習では、MATLABという数値解析用のプログラミング言語を活用していたが、私はRというプログラミング言語の方に馴染みがあるので、今回の研究では一貫してRを活用している。
今でも覚えているが、最初のうちは、RでCRQAを活用するために、データの形式を整えることにも一苦労であり、綺麗なプロット図を描くためのコードを書くことにも四苦八苦していた。しかし、自分なりに試行錯誤を繰り返すうちに、もはやRを用いてCRQAを活用することに対して何らの苦労はない。
コックス教授をはじめ、フローニンゲン大学で非線形ダイナミクスの手法を発達現象に適用している研究者の多くは、MATLABを用いているため、おそらく私がRを用いることに関しては、一番習熟しているのではないかと思われるほどに、Rを用いたCRQAの活用に慣れてしまった。
そして数日前に、MATLABとRを用いた際に、CRQAの結果に齟齬がないのかを調査した論文を発見した。その論文の結論は、Rの方がより数値解析の速度が速いが、両者の数値結果は完全に合致しているとのことだった。
実は、先日のコックス教授とのミーティングの際に、MATLABとRの結果は正しく合致しているのだろうか、という話題になり、コックス教授に自分の解析結果を送り、両者を比較することを依頼していたのだ。もちろん、その論文の結果を私たち自身で検証することも興味深いのだが、もし時間がなければ、両者の比較に時間をかける必要はないという連絡をコックス教授に先ほどした。 CRQAに関する一般的な説明、CRQAを用いるために、どのような種類の時系列データをどのように準備したのか、CRQA専用のRパッケージに関する言及、そして、今回の研究で着目する四つの指標に関する説明を、 “Method”のセクションに盛り込んだ。
先日のクネン先生とのミーティングでも述べたのだが、今の私は、論文を書くことに非常に意欲的である。そのため、明日、CRQAに関する “Results”のセクションを執筆できることがとても楽しみである。2017/3/21