データをもとに確率で作文してるだけでのソフトなのに、あたかも正しい文字列を作文するソフトと思い込んでしまってる事の方が問題なのではないかと。
人間じゃなく、生成AIに作文させてるんですよ?
ちゃんとそれっぽい日本語の文字列を生成してる事に驚くべきなのではないかと。
内容?
そんなもんどうでもいいんですよ。
ただの確率作文なんだから。
多少最新のデータがあろうがなかろうが、それも一切関係ないと思いますよ。
ただ、確率の高い文字列を生成するだけのツールなのだから。
とりあえずは、正しい挙動をしていると評価したらいいだけなのではないでしょうか?
学習データは、今後も持続的に溜め込んでいくでしょうし、幾分、AI特化した情報は整理されていく未来があるのかもしれないし。