これは極めて悪意のあるアイデアです。開発者が、C# コード内の ASCII 文字を Unicode 文字セットのほぼホモグリフに置き換える GitHub プロジェクトを投稿しました。
コード内に絵文字が登場し始めても、その置き換えに気づく人はいないでしょうが、Greg Toombs の「Mimic」はそれよりも微妙です。
彼のスクリプトは、Unicode のギリシャ語の疑問符「;」(U037E) が ASCII のセミコロン「;」に非常に近いため、C# が引き起こすバグを特定するのはほぼ不可能であるというツイートからヒントを得ました。
そこでトゥームズ氏はこのアイデアをさらに推し進め、「Unicode文字セットには、程度の差はあれ他の文字と似ている文字、つまりホモグリフが数多く存在する。Mimicは、あまり知られていないホモグリフを一般的なASCII文字に置き換える」という前提に基づいてMimicを開発しました。
彼は、Unicode の乱用について次のような例を挙げています。
「あるいは、もしあなたがもう少し激しく真似をされたなら」と彼は書いている。
しかし、その影響は単なるいたずらをはるかに超えています。トゥームズ氏は、Unicode の置換は、インデックス作成や検閲を回避したり、フレーズをスパム フィルターに通過させたり、盗作を隠したりするために使用できると指摘しています (盗まれたコード内の置換により、自動検出ソフトウェアがコピーを検出するのが困難になるため)。
防御策はあります。ここで Toombs は Vim、Emacs、Atom のトロールストッパーをリストしています。
そして、2014 年 11 月のツイートで Mimic のアイデアの種を植えた開発者兼著者の Peter Ritchie 氏にも責任があることを忘れてはなりません。
MT: 友達のC#コードでセミコロン(;)をギリシャ文字の疑問符(;)に置き換えて、その文法エラーで友達が頭を抱えるのを見てください。
— ピーター・リッチー(@peterritchie)2014年11月16日
『銀河ヒッチハイク・ガイド』のプロステトニック・ヴォゴン・ジェルツの言葉を引用すると、「死は彼らにとってあまりにももったいない」。®