Okamura’s website

研究紹介

機械学習の堆積岩石学への適用 0. 序論

堆積岩石学について

私は,地質学の中で主に堆積岩石学の分野の研究をしています.堆積岩石学は,堆積学 (地層がどのようにして堆積したかを解き明かす,主に堆積環境や古流向),岩石学 (主に火成岩類や変成岩の成因について) の中間に位置する分野です.

岩石学の中に,砂岩や泥岩などの堆積岩も含まれているにもかかわらず,安山岩や花崗岩などの火山岩や深成岩についてメインに扱われる傾向があります.そのため堆積岩を研究の対象とするとき,堆積岩石学とある種特別なワードを付けることが一般的です.

堆積岩石学の研究手法

堆積岩石学では,堆積岩の組成を用いて研究を行うことが一般的です.古典的には礫組成があります.礫岩の礫が何であるかを同定できれば,その性質や礫種の割合を用いて供給源となった岩石がどのような地質体から供給されたか,さらに言えばどのように後背地が変化したかあるいはしていないかについて知ることができます.

他の手法としては,砂岩組成,砂岩の全岩組成,砕屑性重鉱物組成,重鉱物の化学組成,砕屑性ジルコン年代測定などがあります.30年ほど前から用いられるようになったのが鉱物の化学組成を用いる方法です.これは鉱物一粒,あるいは複数の粒を溶かして化学組成を測っていた従来の方法に対して,非破壊かつ溶かす必要のない装置で化学組成を測ることができるようになったことが貢献しています.化学組成を測るのに使われるのは,EPMAやEDSと呼ばれる機械で前者は一億円近くする機械ですが,岩石学を研究している大学などの研究機関では一般的に置かれています.しかし,もっぱらこれら機械は火成岩岩石学や鉱物学のためのものであり,堆積岩石学のためだけに買っているというわけではありません.

どのような鉱物が用いられるかというと,輝石,黒雲母,電気石,ザクロ石などがよく用いられます.特にザクロ石は,変成岩のザクロ石の場合では母岩の組成と変成度が化学組成に対応しており,化学組成を利用して後背地の岩石の変成度を知ることができるという特徴があります.

砕屑性ジルコン年代測定は,堆積岩中に含まれるジルコンという鉱物を抽出し,LA-ICP-MSという機械で同位体比を測定することで一粒ごとの年代を求めるという手法です.

これにより,その堆積岩,しいてはその地層が堆積したときにどのような年代の岩石が供給源にあったのかを知ることができます.ここ10年ほどで日本にも広く普及しましたが,EPMAほどどこにでもあるわけではありません.

堆積岩石学で用いられる判別図

堆積岩石学では測定した多数のデータを元に判別図が作られ,それを元に未知のデータを判別することで考察することが行われています.これは,なになにダイアグラムみたいな名前が付いていることが多く,地質学分野だけに限った話ではなくて他の科学分野で広く用いられています.

堆積岩石学でよく用いられる判別図としてこのような物があります.砂岩組成では,Gazzi-Dickinsonによる判別図があります.これはGazzi-Dickinson methodと呼ばれる特殊な手法で教師データを測定した砂岩の組成を元に作られた三角図です.

www.jstage.jst.go.jp

ザクロ石の鉱物組成では,いくつかの判別図が考案されており,最近それらがテストデータにより性能が試験されています.

www.sciencedirect.com

それによると日本人の作ったダイアグラムを除いて既存のダイアグラムは性能に大きな差はないようです.

Ultramafics,Metaigneous eclogites,Granulite-facies metapelites起源のザクロ石ではmedium以上の評価 (Potential of discriminationが20%以上) がされていますが,全般的に良い結果とは言えません.つまり変成度の異なる岩石に含まれるザクロ石は,その組成においてこのダイアグラムの表現力では他の領域とオーバーラップが生じており,どれか一つの起源であると組成だけではいうことは難しいということです.

この原因の一つがザクロ石の組成は変成度だけではなく母岩の組成にも影響するということです.これにはテストデータの質も影響してきます.そしてもう一つが,そもそも三角図の三次元ではきれいに分けることが難しい可能性があるということです.

既存の判別図の問題点

ザクロ石組成の判別図を見てみましょう.ひとつの問題点として前述したとおり性能の問題があります.三角図では三成分,三次元しか表現できませんし,見やすさを捨てて四次元にすることも可能ですがそれでも次元に制限があるといえます.ザクロ石組成では,アルマンディン,スペサルティン,パイロープ,グランダイトの四成分から一成分を除いて三成分にする,またどれか二つを合体して一成分にすることが行われています.

もう一つは,人間が主導でラインを引いていることです.教師データを集めてきてプロットして,この領域はなになにエリアという風に割り当てています.これでは適切なラインが引けない可能性があります.

扱える次元に制限かかる問題を解決する方法として,最近は多変量解析のうちバイプロット分析が用いられていますが,正直これは未知データを分けるために行うためで判別手法作成のための手法に組み込むべき物ではないと思います.これだと,教師データベースを元にバイプロット分析で性質を明らかにして,その性質が未知データとどのくらい似ているか判断する作業が必要になりますが,この作業が適正に行われているかは難しいところです.そして,ここでも問題点2で出した人間の手が入ってきます.

機械学習の適用

私は機械学習を用いることがこれらの問題点を解決する手段ではなかろうかと考えています.グラニュライト相の変成岩のザクロ石はこのようなザクロ石の組成を持つといった情報がのっている教師データを用意してそれをもとに学習しモデル化するわけです.岩石化学組成の次元は,機械学習の主戦場である情報学分野と比べて圧倒的に少なく,計算時間の問題は小さいです.一方,既存のDBは一岩石あたり数百とたいしたことなく,これで充分なのかは疑問がある.

地球科学において機械学習を判別図制作に用いた研究は少ないです.例えば,

link.springer.com

しかし私としては,教師データを元に未知データを判別する教師あり学習の手法は,判別図作成において効果的であると考えています.