PDFとアクセシビリティ |
|
アクセシビリティ(accessibility)というのは、要は障害のある人でも誰でも利用できるかどうか、その利用しやすさ、アクセスしやすさ、ということです。ソフトウェアに限らず、ハードウェアや建築物、交通機関などに対してもアクセシビリティの良し悪しを言うことができますが、ここでは電子文書、特にPDFのアクセシビリティについて取り上げます。 (PDFのテキスト抽出、HTML変換方法をお探しの方は、「PDFのテキスト抽出とHTML変換」をご覧ください。) |
電子文書とアクセシビリティ電子というと無機的で非人間的な響きがありますが、電子文書は意外に人に優しい媒体です。 たとえば、紙の本を視覚障害者が読めるかたちにするには、朗読をテープに録音する、点訳するなど、人手と時間がかかり、リアルタイムで情報を提供するのが困難です。また、身体障害があって本のページをめくりにくい人や、弱視で小さな文字を読みにくい人のニーズにきめ細かく応えるのも大変です。 一方、電子文書のテキストデータならば、スクリーン・リーダーなどのソフトを使って音声出力したり、点字ディスプレイに出力したり、文字を拡大表示したり、画面に表示してスクロールして読んだりと、個々の障害に合わせて情報を加工することが可能です。このため、コンピュータと電子文書の普及により、本や雑誌という紙媒体ではなかなか情報を得られなかった人達も情報を得、また情報発信する機会が増えました。 しかし、当初は単純なテキストファイルだったものが、画像や動画、音声を含む複雑な文書に変わるにつれ、情報に容易にアクセスすることが逆に難しくなってきている面もあります。 また、Windows、Mac OSなど、分かりやすくて操作しやすいと言われるGUI(グラフィカルユーザインターフェース)の普及が、逆に障害者のコンピュータ利用を妨げている面もあります。GUIは視覚に依存する部分が多く、DOSのようなCUI(キャラクタベースのユーザインタフェース)にくらべて視覚障害者が操作するのが難しいからです。(画面の任意の位置を指示するという操作を、視覚に頼らずに行うことを想像してみてください。)上肢障害がある人にとっては、微妙なマウス操作よりはキーボードでの操作の方が簡単な場合もあります。 PDFの普及とアクセシビリティの問題電子文書には、さまざまなフォーマットがあります。その中で、なぜ特にPDFのアクセシビリティが問題になるのか。それは、PDFが単なる1企業が提案するフォーマットという範囲を超え、HTML/XMLと並んで、電子文書のフォーマットのデファクトスタンダードとなりつつあるからです。 米国では、政府や公共機関が提供する情報や、電子納品物の標準フォーマットとしてPDFが広く使われています。日本でも、官公庁や自治体のドキュメントが広くPDFで公開されています。また一般企業でも、雑誌記事や製品のカタログ、マニュアルをPDF化しているところが多く見られます。 これは、PDFの次のような特長が、広範囲でやりとりされる電子文書、あるいは長期的に保管される文書のフォーマットに適していると認められているからです。
その一方、インターネットの普及とともに、すべての人が電子・技術情報にアクセスする権利を守ることが急務となり、米国ではリハビリテーション法修正508条およびアシスティブ・テクノロジー法により、2001年6月21日以降(当初予定では2000年8月7日以降)、連邦政府および連邦政府の財政援助を受ける州政府の障害を持つ雇用者と、連邦政府・州政府の情報を必要とする政府外の障害者の両方が、連邦政府・州政府が調達・購入、管理もしくは使用する電子・情報技術にアクセスできることを保証することが義務付けられました。この法律は、製品のマニュアルなどの文書や、連邦政府・州政府のWebサイトにも適用されます。 また日本でも2004年6月20日に制定されたJIS X8341-3で「5.1(b)ウェブコンテンツには,アクセス可能なオブジェクトなどの技術を使うことが好ましい」と書かれている箇所など、直接PDFに言及したものはありませんが、PDFのアクセシビリティも問題になってくるようになりました。 Acrobat 4までは、アプリケーションのメニューや文書の内容を読み上げるスクリーン・リーダーに対応していなかったため、視覚障害者がPDFを簡単に読むことができませんでした。しかし、Acrobat 5以降からは、Windows版ではMicrosoft Active Accessibility(MSAA)を使用したスクリーン・リーダーに対応したため、PDFのテキスト部分の音声による読み上げが可能になってきました。 MSAAについては、Microsoftのサイトに詳しい資料が掲載されています。 ただし、PDF文書を読み上げるためには、Acrobat 5以降側でスクリーン・リーダーを使用できるような機能を持たせただけでは不充分で、スクリーン・リーダー側もAcrobat 5以降対応にする必要があります。 PDFを読み上げ可能なスクリーンリーダー・音声ブラウザ2006年6月16日現在の日本語版のスクリーン・リーダー、音声ブラウザのAcrobat7への対応状況は、次の通りです。
また、Mac版は、英語/日本語のAcrobat 5、6、7のいずれも、スクリーン・リーダーに対応していません。(そもそもMac版のスクリーン・リーダー自体が海外でも数少なく、日本語版のスクリーン・リーダーは存在しません。)しかし、Acrobat 6からは、Mac OS自体の音声合成機能を利用して、英文のPDFならば音声読み上げ可能になりました。また、OS X 10.2からMac版のアクセシビリティAPIも公表され、Adobe Reader 7自体はそれに対応していますので、いずれスクリーン・リーダーなどの支援ソフトがMac版でも出てくることが期待されています。 Adobe Reader 6/7を利用した音声読み上げ音声読み上げAcrobat Reader 6/7では、WindowsとMac OS自体の音声合成機能を利用したPDFの読み上げが可能になりました。スクリーン・リーダーや音声ブラウザがない状態でも音声読み上げできる機能です。Adobe Readerの[表示]メニューの[読み上げ]を実行すると、読み上げることができます。 ただし、OS側に日本語の音声読み上げエンジンが存在しないと、日本語で読み上げることができません。MS Office
XP以降に付属している日本語読み上げエンジンをインストールしていると、日本語のPDFの読み上げが可能です。また、マイクロソフトのサイトから日本語の読み上げエンジンをダウンロードしてインストールすることもできます。 MS Office XPがある場合標準インストールしても日本語読み上げエンジンは標準ではインストールされないようなので、以下の手順で確認し、インストールしてください。
MS Office XPがない場合Adobeサイトの以下のページに、Windows 98 SE/NTと、2000/XPの場合にマイクロソフトのサイトのどのページから日本語音声読み上げエンジンをダウンロードしてインストールするのか記載されていますので、その手順に従ってください。 その他のAdobe Reader 7のアクセシビリティ機能音声読み上げ以外にもAcrobat 5以降からは、弱視の人など向けの画面のハイコントラスト表示、マウスを使えない人のためのショートカットキーのサポートなどがされています。また、音声読み上げ時のための細かな配慮もされるようになってきています。 Adobe Reader 7のアクセシビリティ機能の詳細については、Adobeのサイトの以下の資料で詳しく説明されています。PDFのアクセシビリティというと音声読み上げが中心になりますが、この資料ではキーボード操作の詳細についても触れられています。 Adobe Reader 7.0 でPDFを読む (PDFファイル:4.0MB) オンライン変換ツールAdobeはAdobe Readerがない環境などでもスクリーン・リーダーなどで読み取り可能なHTML 3.2ファイルまたはテキストファイルに変換する手段をオンラインで提供しています。 Online conversion tools for Adobe PDF documents (英語) ただし、このHTML/テキスト変換は英語と西欧圏の言語のPDFを対象としており、残念ながら日本語のPDFをサポートしていません。 オンライン変換ツールでは、以下の2種類のサービスを提供しています。
アクセシブルなPDFの作成PDFをスクリーン・リーダーや音声ブラウザで読み上げることができるといっても問題が残ります。 スキャナでの読み込み画像のPDF化の問題まず、スキャナで読み込んだ画像をPDF化した場合は、そのままでは画像扱いですから、まったく読み上げることができません。この場合は視覚障害者も使えるOCRソフトとスクリーン・リーダー、音声ブラウザの組み合わせで使うことになります。Acrobat 7で、[ファイル]メニューの[PDFの作成]を選択し、サブメニューから[スキャナ]を選択、表示される[スキャナからPDFを作成]ダイアログで「OCRを使用してテキストとして認識」オプションと[文書にタグを追加]オプションを有効にしておくと、音声読み上げできるPDFが作成されますが、残念ながらこの機能はあまり知られていません。 PDFの構造化の問題また、テキストのPDF文書でも、見出しと本文といった文書構造の違いを明確にできない、複雑なレイアウトの文書では、文章が正しい流れで変換されないといった問題が残っています。 この問題の主な原因は、PDFおよびその元となったPostScriptがページ全体の文字や図形のレイアウトを表現するものであり、文書構造を指定するものではないという点に起因します。もともとPDFはテキストを文書構造に従って抜き出したり、HTMLやXMLなどのマークアップ言語との互換性を保つには不向きだったのです。しかし、アクセシビリティの問題だけでなく、電子商取引でPDFが利用される上で、他の文書フォーマットとの互換性が求められるようになり、PDF自体に構造情報を持たせる必要性が出てきました。 このため、PDF 1.3(Acrobat 4.0)からは、新たにLogical Structure(論理的構造)を取り入れ、PDFファイル中に構造情報を持つことができるようになりました。 しかし、PDFを構造化するためにはタグ付きPDFにする必要があります。Word文書をPDF化する時の設定や、PDF化した文書に対してタグ付けすることである程度構造化はできます。また、図に(X)HTMLのalt属性のような代替テキストを付けることもできます。しかし、表の読み上げなどがなかなか難しいという報告もあります。 セキュリティの問題文書の印刷および編集にセキュリティが設定されている場合、音声読み上げできない場合があります。Acrobat 5.0では、文書を保護するセキュリティ設定で内容のコピーやテキストの抽出を許可しない設定にすることができます。この設定を行うと、スクリーンリーダーなどでPDF文書を読み上げることができません。Acrobat 6以降ではセキュリティ設定されているPDF文書でも音声読み上げなどの支援装置に対応しましたが、設定時に注意が必要です。 タグ付きPDF文書の概略とセキュリティ設定の詳細については、以下のAdobeサイトのページで紹介されています。 また、以下のAdobeサイトのPDF文書でアクセス可能なPDFの作成手順について詳しく説明されています。 Adobe Acrobat 7.0 を使用してアクセス可能なPDF文書を作成する(PDFファイル:10.8MB) その他リンク先がPDF文書の場合、なんの断りもなく、リンクをクリックすると突然PDFが開く場合がありますが、これはユーザーを困惑させます。 関連情報AdobeのサイトのAcrobat関連のアクセシビリティの紹介ページです。このページで引用している資料など、豊富な情報が掲載されています。 山口俊光氏が公開されている情報で、アクセシブルなPDFの作成方法についてなど、わかりやすくまとめられています。 スクリーンリーダによるPDF文書へのアクセシビリティについて (PDFファイル:281KB) 国立特殊教育総合研究所の渡辺氏よりいただいた、スクリーン・リーダーのPDF文書の読み上げの検証実験の資料です。Acrobat 5とAcrobat 6で作成したタグ付き、タグなし文書の各スクリーン・リーダーでの読み上げ方が紹介されています。 |