新しいメンバー

  • セリ
  • ひなたぼこ
  • にいな
  • のやま
  • まいまい

点自:初めてのTエディタ自動点訳

淮さんのユーザアバター

皆さま、こんにちは。

着手している『狐には向かない職業』4巻を、初めてTエディタの自動点訳で入力しました。
Tエディタの自動点訳時間は1分弱。
因みに、お点ちゃんで自動点訳すると27分かかりました。

<校正結果>
  △原文ミス
  ●点訳ミス(お点ちゃんは大丈夫)
  ◎点訳ミス(お点ちゃんも×)
  ☆読みミス
  (但し区分けが微妙な箇所あり。私のお点ちゃん辞書はほぼ手つかずです)
---------------------
<第1巻>
△14-12 Sumph        14-12 Sumpf
●21-13 はんふ゛んじゃくと    21-13 はんふ゛ん□じゃくと
●35-17 しまった□みたいた゛。  35-17 しまったみたいた゛。
△53-10 すっほ゜い        53-10 すっは゜い
●58- 6 いた□みたいた゛から、  58- 6 いたみたいた゛から、
●70-10 いた□みたいた゛。    70-10 いたみたいた゛。
●71-10 じょさい□なく、     71-10 じょさいなく、
●89-13 しりたかった□みたいて゛す。  89-13 しりたかったみたいて゛す。
△112-17 ‥‥‥         112-16 (削除)
△121-12 (空行)        121-12 (削除)

<第2巻>
△30- 7 しぇいて゛い        30- 7 しぇいでぃ
●38-11 いまと゛こて゛す?」    38-11 いま□と゛こて゛す?」
△66-11 ヴぇらわ          66-11 □□ヴぇらわ
◎68- 8 よの□なかにわ、      68- 8 よのなかにわ、
●74-13 さん            74-12 (前行へ)さん
●74-16 わかった□みたいて゛す。  74-16 わかったみたいて゛す。
●94- 5 つゆしらす゛、       94- 4 つゆ∥しらす゛、
△118- 5 のへ゛ひ゛た       118- 5 のひ゛た
●127- 9 いなかった□みたいなの。 127- 9 いなかったみたいなの。

<第3巻>
△21- 5 「れふてぃー」        21- 5 「れふてぃ!」
△22-16 いる!」□□わたしわ     22-16 いる!□□「わたしわ
☆45-17 かんじょーしょか゛      45-17 かんじょーか゛きか゛
☆75- 5 しんさ゛んしゃに       75- 5 しんさ゛んものに
△109- 2 はわーと゛わ        109- 2 はわーと゛にわ

<第4巻>
●24- 9 いつもとおりじゃ       24- 9 いつもと゛おりじゃ
●41- 7 いた□みたい。        41- 7 いたみたい。
●85- 8 10_いじょーの       85- 7 10□いじょーの
☆103- 2 くろー〉に         102-18 くろう〉に
●114- 9 あった∥きりて゛したから、  114-10 あったきりて゛したから、
--------------------

まあ、●の多いこと! お点ちゃんは本当にすごい!
お点ちゃんを使えば、上記のミスは防げますね、多分。

自分の名誉のために。
「××みたい」はちゃんと気づいて自分で手を入れた箇所もあることを申告します。
「ぼーっと見直ししてんじゃねえよ!」どうも3巻だけは、意識がもうろうとしてなかったようで。

今後のこともあるし、ミスは自分のせいだしで、私はこれからもTエディタの自動点訳を使います。
上記のようなミスを防ぐために、Tエディタの「Wjisyo3.dic」を今後追加作成していきます。

「お点ちゃん」の辞書保守でもいいし、まだ途上(?)の「Tエディタ」の「Wjisyo3.dic」追加でもいいし。(淮)

Replied
サムケンさんのユーザアバター

Re: 点自:初めてのTエディタ自動点訳

 淮さん。

 自動点訳の比較、興味深く読ませて頂きました。

 自分が通常使用しているお点ちゃんは<が>が<か>に
 変換されたり<ハ>が<(>に変換されたり記号類が
 変換できなかったり……他にも色々あります。

 淮さんの比較をみせて頂きますとほぼ完璧に近いようで
 ???で御座います。
 バージョンが違うのかなとも思いました。
 自分のバージョンはUSBでV4.1です。
 それにしても、Tエディタの自動点訳時間が早いのには
 驚きですよね、お点ちゃんは一節づつしか進行して
 くれませんから随分と違います。
                <サムケン>

Replied
やまべえさんのユーザアバター

Re: 点自:初めてのTエディタ自動点訳

淮さん、こんばんは
今回グル点で担当した短編を自動点訳してみました。
点訳頁にして46頁ほどです。

Tエディタ、お点ちゃん(サムケンさんと同じver.です)、EXTRAは、ver.4(かなり古い!)の三つです。
どれも、短文登録やmy辞書などは使用せず、たんにtxtデータを読み込ませただけです。

自動点訳速度はTエディタと、EXTRAは一瞬。お点ちゃんは2分弱でした。

結果からいうと、点訳ミス数は
EXTRA>お点ちゃん>Tエディタの順でした。これはちょっと意外な結果でした。(お点ちゃんとTエディタのミス数の違いはほんの少し)

淮さんのような細かい分析はできないので、アルファベットの点訳にだけ注目してみました。

〈Tエディタ〉
AI,JK,SNS…外字符 OK
Youtube,Olibia_san…外引符 OK
VTuber…外引符だけれど、惜しい!大文字符の位置が違っている。

〈お点ちゃん〉
ほぼ、外字符で点訳されている。外字符で点訳すべき箇所はOK

〈EXTRA〉
すべて、外引符で点訳されているが、途中のアルファベットが正しく読めていないため、おかしな記号になっている。結果、ほぼすべてのアルファベットが点訳ミス。Olibia_sanのみがOK

〈その他〉
GPT…三つとも外引符で点訳されていた。
3Dモデル… T:数3/外大D/モデル 
      お点ちゃん:OK
      EXTRA:数3引大D引
伏字の〇(⑤マ)…Tエディタ:表示されないか、数字の0
     お点ちゃん:一部OK、数字の0もあり
     EXTRA:一部⑤マと表示されたが、一字ずつマス空けになっている、数字0もあり。

EXTRAは、これまで使っていて、日本語の分かちはかなり正確に点訳されていて、さすが!と思っていたので、とても意外な結果でした。アルファベットの多い文章は相性が悪かったのかも。
今回txtデータで、読点や句点の後ろのところどころに半角スペースが入っていたようで、EXTRAでは、その箇所が読点の後ろが2マス空け、句点の後ろが3マス空けになっていたのが、点訳ミス数の多さになったようです。

私はとりあえず点字データにして、一括置換を利用するなどしつつ、点字データを修正しているのですが、
辞書登録や設定をきちんとすれば、もう少し正確に点訳できるのかもしれません。

やまべえ

Replied
淮さんのユーザアバター

Re: 点自:初めてのTエディタ自動点訳

やまべえさん、こんにちは。
お忙しいところ、比較してくださってありがとうございました。

>VTuber…外引符だけれど、惜しい!大文字符の位置が違っている。

誤:(外引)(大)(大)VT(6)(3)uber(外引)
正:(外引)(大)V(大)T(6)(3)uber(外引)
↑これですね。

ハッチーさんが色々試してくれて、開発者に質問した結果、Wjisyo3.dicを追加するときは

○英文記号いずれも半角
  ピリオドは (.)
  コンマは  (,)
  疑問符は  (?)
  感嘆符は  (!)
  アポストロフィ ('')アポストロフィ二つ
  スラッシュは  (_/)アンダーライン+スラッシュ
  英語・終止符  (")ダブルクォーテーション

あら?(私のWjisyo3.dic)

{||VT"uber}~~{|V|Tuber}

終止符、うまくいかないはずが、今試してみたらちゃんと(6)(3)になってました。
で、大文字符がうまくいってない……。
これ、集中してやってないと、すぐ忘れちゃうので困ります。
申し訳ありませんが、1月になってからまた再挑戦してみます。(淮)

┗━淮(わいY)━┓

Replied
ハッチーさんのユーザアバター

Re: 点自:初めてのTエディタ自動点訳

やまべえさん、淮さん、こんにちは。

>正:(外引)(大)V(大)T(6)(3)uber(外引)
あれっ?
 これは(6)(3)不要で

正:(外引)(大)V(大)Tuber(外引)

ですよね?

私の点訳結果は、「誤」のほうのままです。
dicに追加しても、点訳結果に反映してくれないものもありますねぇ~。

*ハッチー*

Replied
やまべえさんのユーザアバター

Re: 点自:初めてのTエディタ自動点訳

淮さん、ハッチーさん、こんばんは

辞書追加の件、ありがとうございます。
終止符は不要ですね。了解です。

自分で辞書に追加していくことによって、自動点訳の精度が上がるということですね?
これが、大変な作業のような気がします。

もう一つ、よろしければ教えてください。
文書をスキャンしたあと、どのようソフトで、txtデータを作成していますか?
最近は、wordでPDFを読み込み、docx→txt に変換しているのですが、時々自動点訳ができないtxtデータがあるのは、txtデータの作成に問題があるのかな?と思ったりしています。

やまべえ

Replied
ハッチーさんのユーザアバター

Re: 点自:初めてのTエディタ自動点訳

やまべえさん、こんにちは。

>txtデータを作成
「読んde!!ココ」を使っています。

>時々自動点訳ができないtxtデータがある 
う~~ん、どうしてなんでしょうねぇ~。
 SJISで保存するのを忘れた時は文字化けしたことはありましたけど・・・

 

*ハッチー*

コンテンツ配信 コンテンツ配信