まだ辞書を引いていない単語がたくさんありますね

ツイートをちゃんと記事にしてみようのコーナー👏👏 以下のツイートのちゃんとした記事版です


人のコードを読んでるときにはじめて出会った英単語って結構多くて、それらの単語をその周辺の豊富なコンテキストからなんとなくで理解した上になんとなくのまま自分も使ったりしてしまうから、人にその言葉の意味を聞かれても即答できなくて、調べてみて超納得する……みたいなことがとてもよくある。

例えば primitive の意味は今さっき初めて辞書引いたけど、自分のニュアンスとかなり近い結果が返ってきた。

そういった単語は人の技術記事でもカタカナ英語のまま使用されることが多くて、その場合は「日本語の」豊富なコンテキストになるので余計に辞書を引かなくてもなんとかなってしまう。

他にも context(さっきコンテキストっていうカタカナ語を使ったね) とか seek とか parse とか schema とか usecase とか browse とか server とか、ソフトウェア関連でよく出るような単語かつ日本語で書く時にカタカナになってしまう単語たちは多く存在している。なんならもっとたくさんあるし、ここで挙げたものより、もっと納得感のある英単語もあるはず。(サッと脳内のindexから引けなかったわけだけども。)

そもそも日本語にする上で最も近い概念がなく、明治期の日本の方々がやっていたような翻訳語を作らなければならない場面なのにそれができていないからこうなっているんじゃないか?とか思って検索したら以下のような記事が出てきた。

明治期のように、外来語を表す新たな翻訳語を作るというのはどうでしょうか - ことばの疑問 - ことば研究館

一方、現代もこれに倣って、新規の外来語に対して、次々に訳語を新造すればいいでしょうか。現代社会の外来語に接する人々の層の厚さや広さは、知識階層に限られていた明治期とは比較にならず大規模です。一般社会への情報伝播も、マスメディアを通じて一気に広まるなど、事情は大いに異なります。

はーんなるほど、確かに僕はこれらの単語の言い換えとして適切な日本語を見つける/作成されるより前にこの英単語たちと触れているし、そういった単語はみんな僕と同じようにニュアンスで理解しているのだろうな〜。翻訳語を作ろうとしても、それが広まる前にみんながその英単語に慣れてしまった、という状況なのかもしれない。

これは確かによく理解できる。ソフトウェアエンジニアなんかは英語圏の人が書いた文章や単語を見る機会はかなり多いだろうし、知らない分野の日本語の説明なんて最初から当てにしていない節もあるだろう。そのような状況において出てきた知らない単語たちを調べるより、周りのコンテキストから判断して意味を類推するほうが幾分楽なのだろう。また、知らない分野というのは専門性が高くなっており、適する日本語が見つかるかどうかの確証も持てない。しかも、その分野を勉強している間はその概念を英単語としてよく聞くわけで、そうなったらその概念の母親は英語になってしまう。


ここまで書いていて、「じゃあ、どんな外の言葉に対しても*1 "意味を持つ翻訳語" を持っているように見える中国語はどうなんだろう」とか思ったんだけど、そもそもすべての単語が漢字の組み合わせによってできているから造語を作りやすいのだろうし、日本語より楽なのだろうな〜と思った。日本語だと中国語よりも漢字単体の覚える数は少ないだろうし、その分日本語はひらがなとカタカナでカバーしているのだ、という仮説。

ちょっとだけ調べてみたが、中国語における外来語の多様性を見ると、どうやら中国語でも読み方に当てはめた「音訳」という概念はがあるらしく、また外来語に関しては音訳が最も割合高く存在している様子。ただ、分野ごとに見ると、物理、電気、武器、機器みたいなカテゴリでは意訳が多いらしい。

ソフトウェアに関して言えば、技術的な操作やUI上の指示とかオプション、そんなに新しくない技術用語については意訳が使われることが多いらしい。そんなに新しくない技術用語というところは結構面白くて、例としては以下のような対応がある(ChatGPTのGPT-4に聞いてみた)。

  • ブラウザ (ブラウザー) / 浏览器 (liú lǎn qì)
    • 「浏览」は「ブラウズする、閲覧する」を意味し、「器」は「ツール、器具」を意味します。
  • サーバー / 服务器 (fú wù qì)
    • 「服务」は「サービスする」を意味し、「器」は「ツール、器具」を意味します。
  • クライアント / 客户端 (kè hù duān)
    • 「客户」は「クライアント、顧客」を意味し、「端」は「端末、側」を意味します。
  • データベース / 数据库 (shù jù kù)
    • 「数据」は「データ」を意味し、「库」は「倉庫、データベース」を意味します。
  • インターフェース / 界面 (jiè miàn)
    • 「界」は「境界」を、「面」は「面、界面」を意味します。
  • オペレーティングシステム (OS) / 操作系统 (cāo zuò xì tǒng)
    • 「操作」は「オペレーション、操作」を、「系统」は「システム」を意味します。
  • プログラミング / 编程 (biān chéng)
    • 「编」は「編む、編集する」を、「程」は「プログラム、コース」を意味します。

これらはまさに自分が英語のまま捉えている単語なのだけど、中国語ではこれらをちゃんと国内の意味に沿った漢字を宛がえている。おもろい。

また、先程自分が挙げた仮説のようなことも喋っていた。

  1. 言語特性と表現の豊かさ

中国語は漢字を使用しており、各漢字には独自の意味があります。このため、新しい概念や技術が導入される際、既存の漢字を組み合わせて新しい用語を作り出すことができ、その結果として意訳された単語が自然に形成されます。これにより、単語自体がその機能や性質を直接的に反映することが可能になります。

ChatGPTとの対話

また、もう少し調べるとこのような文献*2を発見した。見るに、日本と比較して長期間、外国から単語を仕入れ、何らか訳してきたとのこと。シルクロードとかもあるし、その影響は大きかったのだろうが、中国国内ではそれらは外来語であるという意識も薄いらしい。おそらくは日本語よりも外来語を意訳することについての抵抗が少ないのだろう。

さらに調べると、この記事の冒頭では以下のような記載もあり、やはり日本語と比べるとカタカナ語みたいな、いかにもな外来語は多くなさそうに見える。

中国の日本語学習者は、外来語が多いことに戸惑うことがよくある。

このあたりは言語や国柄の特性の違いによるバランス感を感じる。この手の単語に意訳が多そうな中国語はちょっとうらやましく感じるが、日本語のカタカナで表した単語もそれはそれでコンテキストを損なわずに伝えることができるので嬉しいのだろうなとも思ったりする。深掘りすればもっと色々なものが要因になっていそうなトピックだが、別に言語学者になるほどの熱はないのでこの辺で手を引いておきたい。


ニュアンスで言葉を理解しているときに困るのが(最初に書いた通り)人に説明を求められるような状況で、言語化しなくてもどうにかなっていた部分を急に言語化しなければならなくなって超大変になる。

こういう状態はべつに英単語に限った話ではなくて日本語の単語にもあると思うんだけど、みんなが理解しているような言葉であっても、その言葉の説明を行うのって本当に難しいなと思う。し、その上で辞書を引くとおおよそ納得できる、筋が良さそうな説明が出てきてくれるのでとてもすごいと思う。超グッドワーク。

*1:偏見

*2: 中国語の外来語形成のプロセスと現状 (クリックするとすぐpdfのダウンロードが始まるので注意)