PDFとアクセシビリティ

アクセシビリティ(accessibility)というのは、要は障害のある人でも誰でも利用できるかどうか、その利用しやすさ、アクセスしやすさ、ということです。ソフトウェアに限らず、ハードウェアや建築物、交通機関などに対してもアクセシビリティの良し悪しを言うことができますが、ここでは電子文書、特にPDFのアクセシビリティについて取り上げます。

(PDFのテキスト抽出、HTML変換方法をお探しの方は、「PDFのテキスト抽出とHTML変換」をご覧ください。)


電子文書とアクセシビリティ

電子というと無機的で非人間的な響きがありますが、電子文書は意外に人に優しい媒体です。

たとえば、紙の本を視覚障害者が読めるかたちにするには、朗読をテープに録音する、点訳するなど、人手と時間がかかり、リアルタイムで情報を提供するのが困難です。また、身体障害があって本のページをめくりにくい人や、弱視で小さな文字を読みにくい人のニーズにきめ細かく応えるのも大変です。

一方、電子文書のテキストデータならば、スクリーン・リーダーなどのソフトを使って音声出力したり、点字ディスプレイに出力したり、文字を拡大表示したり、画面に表示してスクロールして読んだりと、個々の障害に合わせて情報を加工することが可能です。このため、コンピュータと電子文書の普及により、本や雑誌という紙媒体ではなかなか情報を得られなかった人達も情報を得、また情報発信する機会が増えました。

しかし、当初は単純なテキストファイルだったものが、画像や動画、音声を含む複雑な文書に変わるにつれ、情報に容易にアクセスすることが逆に難しくなってきている面もあります。

また、Windows、Mac OSなど、分かりやすくて操作しやすいと言われるGUI(グラフィカルユーザインターフェース)の普及が、逆に障害者のコンピュータ利用を妨げている面もあります。GUIは視覚に依存する部分が多く、DOSのようなCUI(キャラクタベースのユーザインタフェース)にくらべて視覚障害者が操作するのが難しいからです。(画面の任意の位置を指示するという操作を、視覚に頼らずに行うことを想像してみてください。)上肢障害がある人にとっては、微妙なマウス操作よりはキーボードでの操作の方が簡単な場合もあります。

(一覧に戻る)

PDFの普及とアクセシビリティの問題

電子文書には、さまざまなフォーマットがあります。その中で、なぜ特にPDFのアクセシビリティが問題になるのか。それは、PDFが単なる1企業が提案するフォーマットという範囲を超え、HTML/XMLと並んで、電子文書のフォーマットのデファクトスタンダードとなりつつあるからです。

米国では、政府や公共機関が提供する情報や、電子納品物の標準フォーマットとしてPDFが広く使われています。日本でも、官公庁や自治体のドキュメントが広くPDFで公開されています。また一般企業でも、雑誌記事や製品のカタログ、マニュアルをPDF化しているところが多く見られます。

これは、PDFの次のような特長が、広範囲でやりとりされる電子文書、あるいは長期的に保管される文書のフォーマットに適していると認められているからです。

  • OSに依存しない。
  • 文書を作成する側のアプリケーションを限定しない。
  • 表示に必要なビューワが無料で配布されている。
  • 元文書と同じかたちで表示・印刷できる。
  • 元文書よりもファイルサイズが小さい。
  • 電子署名など、文書を保護する機能が備わっている。
  • 注釈などを追加する機能が備わっている。
  • しおりやリンクなど、ナビゲーション機能が備わっている。

その一方、インターネットの普及とともに、すべての人が電子・技術情報にアクセスする権利を守ることが急務となり、米国ではリハビリテーション法修正508条およびアシスティブ・テクノロジー法により、2001年6月21日以降(当初予定では2000年8月7日以降)、連邦政府および連邦政府の財政援助を受ける州政府の障害を持つ雇用者と、連邦政府・州政府の情報を必要とする政府外の障害者の両方が、連邦政府・州政府が調達・購入、管理もしくは使用する電子・情報技術にアクセスできることを保証することが義務付けられました。この法律は、製品のマニュアルなどの文書や、連邦政府・州政府のWebサイトにも適用されます。

また日本でも2004年6月20日に制定されたJIS X8341-3で「5.1(b)ウェブコンテンツには,アクセス可能なオブジェクトなどの技術を使うことが好ましい」と書かれている箇所など、直接PDFに言及したものはありませんが、PDFのアクセシビリティも問題になってくるようになりました。

Acrobat 4までは、アプリケーションのメニューや文書の内容を読み上げるスクリーン・リーダーに対応していなかったため、視覚障害者がPDFを簡単に読むことができませんでした。しかし、Acrobat 5以降からは、Windows版ではMicrosoft Active Accessibility(MSAA)を使用したスクリーン・リーダーに対応したため、PDFのテキスト部分の音声による読み上げが可能になってきました。

MSAAについては、Microsoftのサイトに詳しい資料が掲載されています。
MSDN Online - Accessibility Developer Center

ただし、PDF文書を読み上げるためには、Acrobat 5以降側でスクリーン・リーダーを使用できるような機能を持たせただけでは不充分で、スクリーン・リーダー側もAcrobat 5以降対応にする必要があります。

PDFを読み上げ可能なスクリーンリーダー・音声ブラウザ

2006年6月16日現在の日本語版のスクリーン・リーダー、音声ブラウザのAcrobat7への対応状況は、次の通りです。

  • 95Reader(XP Reader)は、Acrobat 7の新機能には未対応。
  • PC-Talker XPは、対応。(PC-Talker 2000は今のところ対応予定なし)。
  • JAWSは、Ver.6.で対応。
  • ホームページ・リーダーは、Ver. 3.04で対応。
  • ボイスサーフィンは、Version3.4で対応。
  • FocusTalkは、対応。

また、Mac版は、英語/日本語のAcrobat 5、6、7のいずれも、スクリーン・リーダーに対応していません。(そもそもMac版のスクリーン・リーダー自体が海外でも数少なく、日本語版のスクリーン・リーダーは存在しません。)しかし、Acrobat 6からは、Mac OS自体の音声合成機能を利用して、英文のPDFならば音声読み上げ可能になりました。また、OS X 10.2からMac版のアクセシビリティAPIも公表され、Adobe Reader 7自体はそれに対応していますので、いずれスクリーン・リーダーなどの支援ソフトがMac版でも出てくることが期待されています。

(一覧に戻る)

Adobe Reader 6/7を利用した音声読み上げ

音声読み上げ

Acrobat Reader 6/7では、WindowsとMac OS自体の音声合成機能を利用したPDFの読み上げが可能になりました。スクリーン・リーダーや音声ブラウザがない状態でも音声読み上げできる機能です。Adobe Readerの[表示]メニューの[読み上げ]を実行すると、読み上げることができます。

ただし、OS側に日本語の音声読み上げエンジンが存在しないと、日本語で読み上げることができません。MS Office XP以降に付属している日本語読み上げエンジンをインストールしていると、日本語のPDFの読み上げが可能です。また、マイクロソフトのサイトから日本語の読み上げエンジンをダウンロードしてインストールすることもできます。
しかし英語の音声読み上げ機能しか標準のWindowsには搭載されていないようです。このため、日本語のPDFでも英語として読み上げようとするので、意味不明の言葉になってしまい、この新機能を使うことができません。
以下のようにすると、スクリーン・リーダーや音声読み上げソフトなしでも日本語でのPDF読み上げが可能になります。

MS Office XPがある場合

標準インストールしても日本語読み上げエンジンは標準ではインストールされないようなので、以下の手順で確認し、インストールしてください。

  1. Adobe Reader 6/7を起動します。
  2. [編集]メニューの[環境設定] を選択し、[読み方] パネルを表示します。
  3. [読み上げオプション] 欄の 「デフォルトの音声を使用」 のチェックを外します。
  4. [音声] プルダウンメニュー内で、日本語読み上げ可能なエンジン(Kenjiなど)が選択できるか確認します。
  5. 日本語読み上げエンジンが表示されず、英語(Microsoft Sam)のみの場合は、Microsoft Wordを起動します。
  6. [ツール] メニューの [音声] をクリックします。
  7. 音声認識機能のインストールを求められた場合は[はい]をクリックしてインストールを行ないます。
    追加された日本語の音声読み上げエンジンが、Adobe Reader 6/7で使用できるようになります。
MS Office XPがない場合

Adobeサイトの以下のページに、Windows 98 SE/NTと、2000/XPの場合にマイクロソフトのサイトのどのページから日本語音声読み上げエンジンをダウンロードしてインストールするのか記載されていますので、その手順に従ってください。

読み上げ機能を使用して日本語の文書を読み上げる方法

その他のAdobe Reader 7のアクセシビリティ機能

音声読み上げ以外にもAcrobat 5以降からは、弱視の人など向けの画面のハイコントラスト表示、マウスを使えない人のためのショートカットキーのサポートなどがされています。また、音声読み上げ時のための細かな配慮もされるようになってきています。

Adobe Reader 7のアクセシビリティ機能の詳細については、Adobeのサイトの以下の資料で詳しく説明されています。PDFのアクセシビリティというと音声読み上げが中心になりますが、この資料ではキーボード操作の詳細についても触れられています。

Adobe Reader 7.0 でPDFを読む (PDFファイル:4.0MB)

(一覧に戻る)

オンライン変換ツール

AdobeはAdobe Readerがない環境などでもスクリーン・リーダーなどで読み取り可能なHTML 3.2ファイルまたはテキストファイルに変換する手段をオンラインで提供しています。

Online conversion tools for Adobe PDF documents (英語)

ただし、このHTML/テキスト変換は英語と西欧圏の言語のPDFを対象としており、残念ながら日本語のPDFをサポートしていません。

オンライン変換ツールでは、以下の2種類のサービスを提供しています。

  • E-MailによるPDFのHTML/テキストへの変換
  • Web上のフォームによるPDFのHTMLへの変換

アクセシブルなPDFの作成

PDFをスクリーン・リーダーや音声ブラウザで読み上げることができるといっても問題が残ります。

スキャナでの読み込み画像のPDF化の問題

まず、スキャナで読み込んだ画像をPDF化した場合は、そのままでは画像扱いですから、まったく読み上げることができません。この場合は視覚障害者も使えるOCRソフトとスクリーン・リーダー、音声ブラウザの組み合わせで使うことになります。Acrobat 7で、[ファイル]メニューの[PDFの作成]を選択し、サブメニューから[スキャナ]を選択、表示される[スキャナからPDFを作成]ダイアログで「OCRを使用してテキストとして認識」オプションと[文書にタグを追加]オプションを有効にしておくと、音声読み上げできるPDFが作成されますが、残念ながらこの機能はあまり知られていません。

PDFの構造化の問題

また、テキストのPDF文書でも、見出しと本文といった文書構造の違いを明確にできない、複雑なレイアウトの文書では、文章が正しい流れで変換されないといった問題が残っています。

この問題の主な原因は、PDFおよびその元となったPostScriptがページ全体の文字や図形のレイアウトを表現するものであり、文書構造を指定するものではないという点に起因します。もともとPDFはテキストを文書構造に従って抜き出したり、HTMLやXMLなどのマークアップ言語との互換性を保つには不向きだったのです。しかし、アクセシビリティの問題だけでなく、電子商取引でPDFが利用される上で、他の文書フォーマットとの互換性が求められるようになり、PDF自体に構造情報を持たせる必要性が出てきました。

このため、PDF 1.3(Acrobat 4.0)からは、新たにLogical Structure(論理的構造)を取り入れ、PDFファイル中に構造情報を持つことができるようになりました。

しかし、PDFを構造化するためにはタグ付きPDFにする必要があります。Word文書をPDF化する時の設定や、PDF化した文書に対してタグ付けすることである程度構造化はできます。また、図に(X)HTMLのalt属性のような代替テキストを付けることもできます。しかし、表の読み上げなどがなかなか難しいという報告もあります。

セキュリティの問題

文書の印刷および編集にセキュリティが設定されている場合、音声読み上げできない場合があります。Acrobat 5.0では、文書を保護するセキュリティ設定で内容のコピーやテキストの抽出を許可しない設定にすることができます。この設定を行うと、スクリーンリーダーなどでPDF文書を読み上げることができません。Acrobat 6以降ではセキュリティ設定されているPDF文書でも音声読み上げなどの支援装置に対応しましたが、設定時に注意が必要です。

タグ付きPDF文書の概略とセキュリティ設定の詳細については、以下のAdobeサイトのページで紹介されています。

PDF文書のアクセシビリティ確保の方法

また、以下のAdobeサイトのPDF文書でアクセス可能なPDFの作成手順について詳しく説明されています。

Adobe Acrobat 7.0 を使用してアクセス可能なPDF文書を作成する(PDFファイル:10.8MB)

その他

リンク先がPDF文書の場合、なんの断りもなく、リンクをクリックすると突然PDFが開く場合がありますが、これはユーザーを困惑させます。

2006年レポート(PDFファイル:1MB)

のように、リンク先がPDFファイルであることと、PDFファイルのサイズも添え、そしてリンク元のページにはAdobe Readerのダウンロードページへの案内も沿えておく方が親切です。

関連情報

Adobe:アクセシビリティ

AdobeのサイトのAcrobat関連のアクセシビリティの紹介ページです。このページで引用している資料など、豊富な情報が掲載されています。

PDF文書のアクセシビリティ

山口俊光氏が公開されている情報で、アクセシブルなPDFの作成方法についてなど、わかりやすくまとめられています。

スクリーンリーダによるPDF文書へのアクセシビリティについて (PDFファイル:281KB)
ヒューマンインタフェース学会研究報告集,Vol.5, No.5, pp.15-22, 2003
著者:吉本 浩二氏、渡辺 哲也氏

国立特殊教育総合研究所の渡辺氏よりいただいた、スクリーン・リーダーのPDF文書の読み上げの検証実験の資料です。Acrobat 5とAcrobat 6で作成したタグ付き、タグなし文書の各スクリーン・リーダーでの読み上げ方が紹介されています。