日本語CTRLを1から学習する - 14
はじめに
日本語CTRL学習2回目の結果をまとめる。
結論だけ述べると前処理を修正して再学習する必要がある
オリジナル文章の生成
600000ステップの結果
物理学には愛がある。 | |
---|---|
青空 | 物理学には愛がある。之を見つけるまでには、必ずこの題材を考えなくてはならない。物理学者のデイビッド・ライツクロフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフトフト |
知識 | 物理学には愛がある。 物理学の分野において、物理学は、物理学の分野において、最も重要な役割を果たす。 物理学は、物理学の分野において、最も重要な役割を果たす。 物理学は、物理学の分野において、最も重要な役割を果たす。 物理学は、物理学の分野において、最も重要な役割を果たす。 物理学は、物理学の分野において、最も重要な役割を果たす。 物理学は、物理学の分野において、最も重要な役割を果たす。 物理学は、 |
訳 | 物理学には愛がある。 |
過去というものは未来の積み重ねである | |
---|---|
青空 | 過去というものは未来の積み重ねである。そして今これ等のものが吾人の心に刻み込まれる。まして眼の前に我々の足跡が現われ、現の世界となっているからには、既知の世界も現われ、現の世界も現われという世界も現われという世界も現われという世界も現われという世界も現われというに至るのである。我もその影を今に刻み込んでいる。一太子の立像は永遠に歴史の中に刻印している。現代の如史史は美しくオアシスの趣がもっとも少くないことを読んで |
知識 | 過去というものは未来の積み重ねである。未来の積み重ねは、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の積み重ねの過程を、未来の |
訳 | 過去というものは未来の積み重ねである |
既存の概念を覆す帽子 | |
---|---|
青空 | 既存の概念を覆す帽子とその概念のうち「浪曼主義」は、その概念を単なる概念の《意識力によって》《が包むもの〉であって、いわば、いわば、いわば、概念の主張にすぎない。だが、従来の唯物論が近代科学を放棄して、精神産業革命の源泉と取っ組んで、その上に、資本主義のあらゆる発展は乗り越えようとする試みであると同時に、新しい基礎理論を出現せしめたものと考えられる。そしてかかる絶望的な目的への、実に、 |
知識 | 既存の概念を覆す帽子は、そのデザインを「帽子」と「帽子」に分類し、そのデザインは「帽子」と「帽子」の2種類に分類した。 帽子は、帽子の「帽子」と「帽子」の2種類に分類した。 帽子は、帽子の「帽子」と「帽子」の2種類に分類した。帽子は、帽子の「帽子」と「帽子」の2種類に分類した。 |
訳 | 既存の概念を覆す帽子を |
前回から学習が進んでいる様子はない。
解くに「知識」制御コードはほとんど長文生成ができていない。
これは単純に学習しているデータによる言語モデル生成の難易度が高すぎるのではないかと思う。
Wikipediaデータは長文が多く256トークン以内に終了する文章が少ない。
そのため終了条件が正しく学習できず同じような単語を繰り返す結果となっているものと思われる。
現状の計算リソースでなんとかするためWikipediaデータは記事の最初の400文字程度のみを学習
することとして再学習を行うこととする。