TED 字幕で 注意すること
|
Talkies; The Chunk Player Mint on Web
自然素材 TED-Talks の特性をよく知って 活用しよう
- 自然素材 とは: 教科書や参考書のように あらかじめ学習を目的として作られたものではないものを 学習に使うとき、そうした著作物 media を自然素材(Authentic Materials)と呼ぶ。たとえば、映画やニュースや文学作品などがよく使われている。
|
もくじ |
- はじめに
- 英語字幕 音声と字幕の 同期
- 英語字幕 書き起こしの 正確さ
- 英語字幕と 日本語字幕の 整合性
- チャンク訳 について
- 音声と字幕のズレについての 考え方と 対策
|
|
|
著名な(さらには 魅力的な発想を持つ無名な)人々による すぐれたプレゼンテーションが 手軽に トーキーズに組み込めるのは、語学教育にとどまらず 教養文化や専門教育にとっても たいへん 有意義なことである。もちろん、主催が北米で 主要言語が英語であることは 内容に一定の フィルターがかかっていることに留意しなければならないが、知的レベルと話題の豊富さは 群を抜いている。
生きた素材を トーキーズに組み込むことで 一気に教材にまで仕立て上げられることは 語学にとって たいへん うれしいことだ。トーキーズは Authentic Materials (自然素材)というじゃじゃ馬を 飼いならす手綱である。
しかし、断っておかなければならないことが ひとつだけある。それは 字幕が 個々のボランティアによる 奉仕活動の結果であることだ。彼らの善意の泉は 必ずしも「語学教育のため」という動機で 湧き出しているとは言えない。ある専門分野の内容を いち早く きちんと 母国語で伝えたいということもあるだろう。
そこで ここに 「TED 字幕 教育利用の注意点」をまとめておく。
|
|
音声と字幕の 同期は
それほど正確ではない
映画の字幕のように 映像を流しながら 字幕を目で追っている限りでは 意外と気が付かないこともある。しかし トーキーズのように 音声をフレーズ単位で再生利用し始めると「アレ?」と言いたくなることがある。
まず 音声と字幕の関係について 具体的に観察してみよう。
例として トーキーズ収録の作品「How great leaders inspire action / Simon Sinek」を取り上げる。
第6フレーズと第7フレーズを見よう。
ひとつの文が 2つのフレーズに分かれている。この文の波形図は以下のようになっている(解析は m-Boxed)。
- 波形のすぐ下の英文は 波形に対応した音声の書き起こし。
- 下段の縞模様は周波数解析(いわゆる声紋)になっている。
- ちょうど左右の真ん中あたり(赤い逆三角形 ▼の位置)に ちょっと長めの波形の谷間(ポーズ)があり、周波数解析では雑音が薄く見られる。これは吸気雑音である。
- つまり この文は 途中1回の吸気によって区分された 2.5秒弱の ふたつの呼気段落(Breath Group)から構成されていることがわかる。
この図に TED 英語字幕を並べると 次の図になる。
- 上の波形が 音声と文字を同期させた図。
- 下の波形が TED の字幕。
- 左下の背景が青いのが第6フレーズ
- 右下の黄色いのが第7フレーズ。
本来なら 呼気段落(BG)の切れ目で 音声を分けるべきだ(字幕は そうなっている)が、TED 字幕では先頭BGの途中で分けてしまっている。時間にして1秒強だけ 区分位置が ずれていることがわかる。
実際に音声を聞いてみると、第7フレーズは
- ..ter year, they're more innovative than all their competition.
と聞こえる。字幕にはない ..ter year, が聞こえるだろう。
また、第9フレーズを再生してみると、直前のフレーズの末尾にある company. という単語から 始まっていることがわかるだろう。解析してみると数の波形となった。
- 背景が緑色の波形が 字幕 ”9 They're just like everyone else.”に対応した音声部分だ。
- 青色の背景部分が 直前のフレーズの末尾単語 ”company”だ。
- このフレーズの字幕に 音を合わせるには 開始位置を0.5秒ほど 右にずらす必要がある。
TED 字幕での 音声と字幕の同期は それほど正確ではない。
トーキーズで TED 字幕を 教育利用する時には 「音声と字幕の 同期は それほど正確ではない」 ことに留意が必要となる。
字幕作成者らは まさか トーキーズのように フレーズ単位=字幕単位で 利用されるとは 想像だにしていなかったろう。しかし 今後の教育利用を思うとき、音声と字幕の同期を きちんと合わせた 字幕ファイルの作成が望ましいことは 言うまでもない。
近い将来の企画として、教育利用者(先生)が 自分で 同期を修正できるような機能を トーキーズに加える予定である。
|
|
プレゼンターの言葉が そのまま
文字に書き起こされているとは 限らない。
私が見聞した限りでは かなり一致している。その限りで ほぼ 安心して使えると思う。
しかし、100%大丈夫かと 念を押されると 「No」 と言わざるを得ない。
例として 先に使った トーキーズ収録の作品「How great leaders inspire action / Simon Sinek」の第6フレーズを注視する。第6フレーズと第7フレーズを パラグラフ設定して 通して聞いてみよう。
字幕では "Year after year, after year," となっているが、音声は "Year after year, after year, after year," と聞こえるだろう。"after year," が 1回分 抜けている。
このような 「字幕と音声の不一致」 に英語初級者が出会ったとき、「字幕が間違っている」と判断する前に、「自分の耳が 悪い」と思ってしまうかもしれない。
適切な指導者の下で 教材とすることが望ましい。
|
|
初級者にとっても 専門分野の学習者にとっても 日本語字幕の存在は とてもうれしい。何より 辞書を引く手間が いらないし、文脈の中での適切な日本語が与えられると、英語も活きてくる。日本語字幕があれば 開いてみよう、授業で使おうという気持ちにもなりやすい。ボランティアの皆さんの ご苦労には この場を借りて 感謝したい。
感謝しています
ありがとう ございます
その上で 語学学習利用の観点から いくつかの注意点を指摘する。
(1)英語字幕と 日本語字幕では
フレーズ数が 違う
「えっ どう言うこと?」と 思われるかもしれない。初めて気づいた時には 私自身も 驚いたからだ。
先の例で取り上げた トーキーズ収録の作品「How great leaders inspire action / Simon Sinek」について 調べると、英語字幕数は381個、日本語では440個なのだった。
1割以上も 日本語の方が 字幕が多かった。
この現象は この例だけではなかった。たとえば 次のような感じだ。
- May El Khalil Pattie Maes eL Sseed
- 英語字幕数 153個 138個 101個
- 日本語字幕数 166個 151個 101個
同じ数であることの方が まれのようだ。
「英語字幕の フレーズごとに 日本語に訳しているわけではない」ことが 明らかになった。
英語を日本語にすると 文字量が増えてしまい、1回に提示する字数を見やすい分量に減らすために ふたつに分けてしまうことが ひとつの原因かもしれない。しかし それだけでもないようだ。
それでは、英語字幕と日本語字幕は どのような関係にあるのだろうか?
(2)英語字幕と 日本語字幕では
並び順が 違うこともある
再び 先の例 「How great leaders inspire action / Simon Sinek」で見てみよう。
以下の例での 字幕文字の左端にある数字は トーキーズでの フレーズ番号である。
- - - - - - - - - -
例 1
- - - - - - - - - -
英語字幕の 出だしの1行目は 2つの日本語字幕に分けられていた。
1 | How do you explain when things don't go as we assume? |
| ↓ |
1 | 物事がうまく行かなかったときに |
2 | それをどう説明しますか? |
- - - - - - - - - -
例 2
- - - - - - - - - -
2 | Or better, how do you explain |
3 | when others are able to achieve things that seem to defy all of the assumptions? |
| ↓ |
3 | あるいは常識を全てひっくり返すようなことを |
4 | 誰かが成し遂げたときに |
5 | それをどう説明しますか? |
- - - - - - - - - -
例 3
- - - - - - - - - -
この例では 3つのフレーズが 2つの字幕になっていた。
10 | They have the same access to the same talent, |
11 | the same agencies, |
12 | the same consultants, the same media. |
| ↓ |
12 | 同じような人材を同じように集め |
13 | 同じような代理店やコンサルタントやメディアを使っています |
英語と 日本語の語順の違いが 字幕の対応順に ほぼそのまま 反映されていることがわかる。
つまり 「耳で聞いているフレーズの意味と 提示されている日本語字幕の意味は 必ずしも一致しない」 ということになる。
この否定表現を 肯定表現に直すと、「字幕の意味は センテンスでつかもう」ということになるだろう。
こうした 「日英字幕のずれ」を解決する手法として わたしたちの研究グループでは「チャンク訳」を 使ってきた。
例1と例2を チャンク訳にすると たとえば 次のようになる。
| 英語字幕
| 日本語字幕
|
1 | How do you explain when things don't go | 物事が進行しなかったら どう説明しますか? |
2 | as we assume? | 思い通りでなかったら? |
3 | Or better, how do you explain | あるいは どう説明しますか? |
4 | when others are able to achieve things that seem to defy all of the assumptions? | 常識を全てひっくり返すようなことを 誰かが成し遂げたときには? |
「わたしたちの研究グループ」では チャンク訳によるトレーニング・ブックを刊行していますので、参考になれば 幸いです。
チャンクで速読トレーニング 英語脳を鍛える!
|
|
「チャンク訳」という言葉は 初耳だという方が 大半でしょう。わたしたち「チャンク研究グループ(別名 チーム・ミント)」の造語です。初出は 先に紹介した「チャンクで速読トレーニング 英語脳を鍛える!」(2010 国際語学社)だと思う。
研究グループでは プレーヤーミントというチャンク提示ソフトを使って 教授法の研究をしている。それは 音声を2秒前後のチャンク(音響的には 呼気段落 Breath Group)に区分けすることから始まる。この時の音声チャンクに 「日本語訳をどのようにつけたらいいか」 との課題を解決する手法を「チャンク訳」と呼ぶようになった。
ちなみに、「音声チャンク」は ほぼ「意味チャンク」であることが わかっている。「音のかたまりは 意味のかたまり」ということだ。このかたまり(音声連続)は 平均2秒程度であることも わかっている。
また 音声チャンクを書き起こした文を「フレーズ」とも呼ぶこともある。
ここでは 日本における英語学習を念頭にした 説明をする。
- 2秒前後の音声チャンクに対する 日本語訳
- 必然的に 音声チャンクと日本語訳の個数は 一致する。
- 翻訳したとき 日本語が長くなることもあれば 逆に短いこともあるが、字幕の読みやすさを考慮して 訳文の配置を 調整することはしない。
- 英文(センテンス)が いくつかのフレーズに分かれたときでも 訳順は 変えない
- これは 英語と日本語の語順の違いを 字幕にどう反映させるかという問題に対する 対処法。
- 英文を 日本語順で解釈し直すのではなく、英語音声を そのままの語順で 意味理解する習慣づけを 考慮したもの。
- 日本語訳は 直訳ではなく 普段の日本語に近づける。
例として 先の「チャンクで速読トレーニング 英語脳を鍛える!」に収録した「Unit 1 マイケル・ジャクソン物語」の冒頭を紹介する。
| 英文 | チャンク訳 |
1 | Today | 本日は |
| | |
2 | we tell about one of the most famous performers in the world, | 世界で最も有名なパフォーマーの一人について話します |
| | |
3 | Michael Jackson. | マイケル・ジャクソンという |
| | |
4 | Known as the "King of Pop," | "ポップの王様" として知られ |
| | |
5 | Jackson sold more than 750 million albums | ジャクソンは7憶5千万枚以上のアルバムを売って |
| | |
6 | over his career. | 生涯で。 |
|
|
トーキーズでは 字幕のクリックで音声を再生し、字幕(フレーズ)単位で処理するので、音映像と字幕との精細な同期が要求される。
そこで、TED字幕をそのままトーキーズで教育利用する場合に注意しなければならないことがある。
主な注意点は以下の3つ。
- 時間同期
- TED字幕は 字幕と音声の同期が 不正確なことがある。
- 字幕をクリックして再生される音声に直前の字幕の末尾が入り込んだり、次の字幕の冒頭の音声が入り込んだりすることがある。
- 詳しくは こちら ⇒英語字幕 音声と字幕の 同期
- 書き起こし
- TED字幕は 書き起こしが 不正確なことがある。
- 音声が正しく書き起こされていないことがある。
- これは映画字幕でよく経験することである。
- 詳しくは こちら ⇒英語字幕 書き起こしの 正確さ
- チャンク訳
残念ながら これらのズレは すぐには改善できない。
そこで 改善計画を立た。計画は 中期と長期に分けてある。
中期計画では、利用者・指導者(教員)が自分で 編集できるようにする。これは トーキーズに編集機能を持たせること(トーキーズ・プロ版)で 実現可能となる。
長期計画では、TEDボランティアの協力を得て、初めから 教育的に妥当性の高い質を保証してもらう。これは ボランティア自らが トーキーズ・プロ版を使って 字幕を作成することで 可能となる。あるいは トーキーズ・プロ版を使える人が ボランティアとして 字幕作成に参加する。
- 時間同期
- m-Boxedと同様に 時間編集機能をもつ トーキーズ(プロ版)を作る。
- m-Boxedでは 音声を波形・周波数表示してフレージングできるようになっている。
- これとほぼ同様に、音声を視覚化して字幕(フレーズ)の調整を 簡便にする。
- 来年(2016年)の夏までに公開予定。
- 書き起こし
- 字幕テキスト編集機能をトーキーズに追加する。
- 指定した字幕(フレーズ)の文を 書き換えられるようにする。
- 来年(2016年)の春までに公開予定。
- チャンク訳
- 内容的には 上で述べた 書き起こしと同じ。
- ただし、英語字幕と日本語字幕の 数をそろえるかどうか、チャンク訳という手法が 一般的に 通用するかどうかという 検討課題が残る。
- 映画のように 通して 筋を伝えるには チャンク訳では 限界があるかもしれない。
- 時間同期
- m-Boxedと同様に 自前のコンテンツ(動画)をインストールして自動的にフレージングできるようにする。
- これが実現すると TEDのプレゼンに限らず 好きな動画を自由にトーキーズにインストールできるようになる。
- 書き起こしとチャンク訳
- 自動フレージングによる作成の場合、英語字幕と日本語字幕の対応関係は1対1となる。つまり 数が一致し、チャンク訳になりやすい。
中長期計画では、ボランティアの共感と協力が不可欠となる。
2015/10/27 改訂 #6を追加 田淵龍二
2015/10/15 田淵龍二
|
 |