日本語を取り巻くステノの環境

かな配列を作っている大岡さんの発言
「英語は開音節言語なのでステノが実装できる」「日本語のステノは難しいのでは?」「ステノではなく漢直という選択肢がある」
→ 普通にステノワード・ソクタイプというのが実装されて実用されているという事実に反するから反論したい。
→ 日本語のステノがオープンな資料がないのと、認知度が足りてないのが原因だと思っている。

英語は開音節言語なのでステノが実装できる。
この意味を解説するために、英語のステノをざっくり解説します。

まず音節についてですが、簡単に言うと、子音→母音→子音の塊のことです。
例えばsubwayという単語の場合、sub/wayという2音節に別れます。
subは子音→母音→子音となっており、wayは子音→母音です。

英語の場合1音節の複雑性・エントロピーが高いという特徴があります。

英語のステノは、
左手で前子音、両手親指で母音、右手で後子音
という形になっていて、基本的には1ストロークで1音節を入力するようになっています。
それに加えて、頻出する語句の並びは、略語というショートカットが実装されています。
たとえば、I didn’t need を1発で出すことができます。

日本語の音節のエントロピーが足りない。1300程度しかエントロピーが無い。
実際に使われるのは800くらい?

ハングルの場合すべてのパターンは1万通りを超える。
実際に使われているものは2000程度ではあるものの、1音節あたりのエントロピーは日本語を超える。
ハングルのステノも英語と同じように、1ストローク1音節+略語というふうになっています。

あと、普通にQWERTYでも人間が話すスピードに追いつけるという話もあったりする。
Realforceの大会が有名。


既存の日本語ステノの特徴など

システム方式特徴
ステノワード1+略語1ストロークあたりのエントロピーが一番低い。略語多め。
ソクタイプ2+略語オープンなものが存在しない。裁判所で使われている。略語多め。
まち針2+漢語シンプルな2音節体系。
メジロ式2+漢語親指3キーでまち針よりエントロピーが高い。

1音節、1泊、1文字の考え方。

1ストロークに、1音節にするのか、1泊にするのか、1文字にするのか。
1ストロークに、2音節にするのか、2泊にするのか、2文字にするのか。

かな配列は、ほとんど1ストローク1文字といえる。濁点や拗音を出すキーがあるが、基本的に同じ指には割り当てられてないので、ほとんど同タイミングで入力できることから、1ストロークとみなしてもいいだろう。

かなとローマ字は1.8倍?くらいの効率になっている。

逆に音節にこだわった場合
出現率の低い音節も、ストロークのパターンに登録する必要がある。
たとえば「ンゴ」とか「しゅうん」とかである。「しゅうん」とかは使う機会まったくないけど
日本語の音節の組み合わせとしては存在する。ンゴはンゴロンゴロで使います。

つまり、既存の文字ベースの解析ではなく、
音節やモーラで頻度の解析をして、それでどの音節を削るのか、どのようにエントロピーや次元を区切るのか。


手書き式速記の学び

手書き式速記においては、1ムーブ1音節+略語になっていた。(たぶん)
これに加えて、漢語のショートカットなどが用意されていた。
感覚的にはステノワードにちかい。

「とーきょー」と「とうきょう」は、機械式速記では区別されるが、手書き速記では区別されない。


次元をどうするか

これの意味はキーの役割をどのように決めるのかという話です。
キーにどうやって意味をもたせるのかという話でもあります。


1ストロークでどこまで入力できるようにするべきか

いままで、1ストロークですべての音節を入力できるようにと思っていたけど、
1文字に比べれば、1音節はエントロピーが大きすぎる。
それに、「とーきょー」と「とうきょう」の違いもあるので、ある程度文字ベースで考える必要がある。

まあ、その取捨選択です。


機械式速記の目標

早くタイピングができるようになる。

  • ある速度まで早く習得できる。
  • ある文章を早く入力できる。
    の2つの意味。

音声の文字起こしにこだわっているわけではない。

→ 文字ベースの解析を行っていきたい