よくある質問

自己レンズ現象はどれくらい稀ですか?

非常に珍しいです!運が良くても、SuperWASPのデータセットから10個程度、TESSデータセットから100個程度ほどしか見つからないと予想しています。連星系内のブラックホールによる自己レンズ現象の確実な例はまだ発見されていないので、1個でも見つかれば科学史に残る成果となります!

なぜシミュレートされた光度曲線を混ぜていますか?

私たちが探している現象は珍しく、実際の例がありません。そこで、2つの理由でシミュレートによる、実際の観測ではない作り物のグラフを混ぜています。まず、皆さんに定期的に実際に探している光度曲線の例を見せることで、本当にマイクロレンズ現象があった際にそのグラフを見過ごさないようになります。2つ目は、多種のシミュレートによる光度曲線を混ぜることで、Zooniverseのボランティアがどれくらい低い増光率の現象まで見分けられるかを調べるためです。

光度曲線がシミュレートされたものかはどうやって分かりますか?

シミュレートによる光度曲線のメタデータには、シミュレートに用いたパラメータを記録しています。サブジェクト情報(画像下のiマークのアイコン)をクリックして、こうしたエントリがあればそのサブジェクトはシミュレートによるものです。その光度曲線がたとえシミュレートによるものでも、本物のマイクロレンズの兆候のある光度曲線同様 「はい」と答える必要がある ことに注意してください。

この分類はコンピューターにもできるのではないですか?

光度曲線にはノイズが多く含まれる可能性があります。そのため、マイクロレンズ現象の起こった光度曲線のノイズを含めた形状を、自動検出アルゴリズムを設計できるだけの精度で予測するのは困難です。
また、実際の信号がどのように見えるかを正確に予測できなければ、実際の信号を見逃す可能性があります。

最新の機械学習手法であればこの課題をいくらかは乗り越えられるかもしれませんが、注意すべきは、こうしたアルゴリズムは探しているピークの全体の形状ではなく、その中の非常に細かいささいな構造に注目する傾向があることです。アルゴリズムを正しく使うには、実際の信号によく似たトレーニングデータを用いることが重要です。しかし、このプロジェクトで使用しているシミュレーションデータでも、トレーニングデータとして使える精度には達していません。狙っている対象の大まかな見た目をつかむためには役立ちますが、現実の信号とは大きく異なるため、これらでトレーニングした機械学習アルゴリズムを使っても多くの信号が見逃されるでしょう。

人間が分類する利点は何ですか?

人間は、数個の例から推測したり、示された例と似ているが同一ではないパターンを見分けることが得意です。これは、まさに、これまでに発見された実際の例がなく、限られたシミュレーションから推測しながら探すしかない、本プロジェクトのような試みで大きなアドバンテージとなります。