2020-05-11から1日間の記事一覧

日本語CTRL学習結果まとめ

はじめにこれまで学習してきた日本語CTRLの最終モデルをまとめる。学習曲線学習は500Kステップ行った。 train loss の学習曲線(span=5000のewmaでスムージング済み) 学習曲線を見る限りはほぼ収束しているように見える。推論結果いくつか推論して見た結…