わかりやすいAI-日大の私でもわかるPARTⅦ

やる気出してます!

で、今回は、いきなりSPAに載っていた記事を見たら、やはり、中国がAI先進国になりつつあるみたいですが、やっていることが秩序が乱れそうなので、気になる人はSPA買って読んでください。

朕の方は、早く、結論を書きたいのですが、まだ、記事を書く上で、すっ飛ばすわけには行かないので、もう少し、理論を書かせていただきます。

前回、ディープラーニングの難しさをご説明しましたが、今回は、【AIが学習するとはどういうこと?】をお話します。この表現が難しいのですけど、「パラメータを持つ関数」のパラメータ部分を調整する。

数式に直すと簡単です。

入力1に何かを足すと→3で出力された場合は、何かを足すというのが2というパラメータです。

なので、2を入力すると4が出力されます。

これがパラメータの調整方針と言います。これが学習データといわれています。なので、【この何かというものが重要なのです】。で、お腹空いたので、いったんここまで。

では、続きを。

「モデル」というのは、パラメータの持つ関数をいいます。教師あり学習なら、入力と正解の出力がセットになった教師データも加えます。できるだけ、入力と出力のセットがうまくいくように与えられた関数のパラメータを調整学習していくのです。

AIを使う上で重要なことは?

大切なスキルは何だと思いますか?それは、プログラミング能力でしょうか?それとも数学知識でしょうか?

この2つのスキルがあるに越したことはありませんが、重要なのは、【課題の本質をとらえる力】【データを作成する力】なのです。

たとえば、AIに解決しもらいたい課題として、書類の不備をチェックする作業を与えるとします。この作業にどういう点が課題として存在しているかをAIにやらせるべきというわけです。

よいAIを作るには質の良いデータを準備するかなのです。なので、データの量や質で差をつけることが大事です。

たとえば、エログロの画像や動画を排除するためには、どうすれば良いか、おそらく、もうじき、Googleで、実用化しているかもしれませんが、これも1種のAIの活用なのです。キーワードや画像データを何万種類も用意して、このデータをさらに再分割して、それに基づいて、抽出をする。しかし、最終的には人間が判断する必要があるのではないかと思いますが、だいぶ、手間が省けます。

ここで、問題となるのは大量のデータを集めること、たとえば、お金、スポーツ、音楽などの、文章をどこから、大量に仕入れてくるが、簡単か、これは、自分の解釈ですが、ここ数年、クラウドワークスとかランサーズとかでライティング、1文字0.1円~0.2円とい安価な仕事があります。もしかすると、データ収集している輩がいると思います。特にキーワード検索の楽な仕事と題して、かなり手間がかかる仕事も見受けられますが、これは、もしかするとAIの下地作りを行なっている可能性がありますので、あまり、お勧めしません。

やはり、人間にとって、仕事とはそういうものではないと思います。朕のように自由気ままに文章を作成する方が楽しいですし、ましてや、1文字0.1円って、どういうこと?1万字で1,000円。こんなバカバカしいことありませんから。