ChatGPTが「視覴」という新語を発明したらしいことをフガクラさんのツイート()で知る。
すでに「視覴」は、いくつかの最近書かれたWebページで使われていた。ChatGPTで生成されたページらしい。ざっと検索して見つけたページを列挙しておく。いずれも最近作られたか修正されたページである(1件だけ2020年のページがあるが、最近修正されたものかどうか不明)。
使われ方を見ると、「視覚」または「視聴」の意味らしい。そこで、「視覴」「視覚」「視聴」のUTF-8バイト列およびChatGPTで使われているcl100k_baseエンコーディングによるトークンを調べてみる。
視覴 e8 a6 96 e8 a6 b4 |25038|244|25038|112| 視覚 e8 a6 96 e8 a6 9a |25038|244|25038|248| 視聴 e8 a6 96 e8 81 b4 |25038|244|36735|112|
どうやら「覚」の前半と「聴」の後半が交差してくっついたみたいである。
同様なものがないか探したところ、Pomo Rossoさんのツイート(2023-06-09 08:32:30)で「知覘」という造語があるようだ。
知覘 e7 9f a5 e8 a6 98 |知|25038|246| 知覚 e7 9f a5 e8 a6 9a |知|25038|248| 知識 e7 9f a5 e8 ad 98 |知|92148|246|
こちらは「覚」の前半と「識」の後半が交差したようである。こちらの利用例はあまりない。
寝蔭(ねかげ)という造語も観測されている。これはトークンの交差ではなく普通の造語のようだ。
高木さんのツイートに添付されているスクショの「マルウェア」が2箇所とも「マリウェア」になっているが、これは言い間違えだろうか。
他の例があればお教えください。
[2024-02-13追記] 複雧
[2024-02-14追記] 勤勠記録(勤務と勤怠の交差)