「視覴」の謎

ChatGPTが「視覴」という新語を発明したらしいことをフガクラさんのツイート)で知る。

すでに「視覴」は、いくつかの最近書かれたWebページで使われていた。ChatGPTで生成されたページらしい。ざっと検索して見つけたページを列挙しておく。いずれも最近作られたか修正されたページである(1件だけ2020年のページがあるが、最近修正されたものかどうか不明)。

使われ方を見ると、「視覚」または「視聴」の意味らしい。そこで、「視覴」「視覚」「視聴」のUTF-8バイト列およびChatGPTで使われているcl100k_baseエンコーディングによるトークンを調べてみる。

視覴 e8 a6 96 e8 a6 b4 |25038|244|25038|112|
視覚 e8 a6 96 e8 a6 9a |25038|244|25038|248|
視聴 e8 a6 96 e8 81 b4 |25038|244|36735|112|

どうやら「覚」の前半と「聴」の後半が交差してくっついたみたいである。

同様なものがないか探したところ、Pomo Rossoさんのツイート(2023-06-09 08:32:30)で「知覘」という造語があるようだ。

知覘 e7 9f a5 e8 a6 98 |知|25038|246|
知覚 e7 9f a5 e8 a6 9a |知|25038|248|
知識 e7 9f a5 e8 ad 98 |知|92148|246|

こちらは「覚」の前半と「識」の後半が交差したようである。こちらの利用例はあまりない。

寝蔭(ねかげ)という造語も観測されている。これはトークンの交差ではなく普通の造語のようだ。

高木さんのツイートに添付されているスクショの「マルウェア」が2箇所とも「マリウェア」になっているが、これは言い間違えだろうか。

他の例があればお教えください。

[2023-07-13追記] 脱糪ログ

[2024-02-13追記] 複雧

[2024-02-14追記] 勤勠記録(勤務と勤怠の交差)