Upload
hiroki-kaneko
View
562
Download
0
Tags:
Embed Size (px)
Citation preview
書籍の電子化に関する体験談2013/4/8 金子弘樹
話すこと
• ある本のPDFを元にEPUBブックを作成した体験談
• はじめて自炊代行サービスを利用した感想
• EPUB作成ツールの未成熟に驚く
• 右綴じ、縦書きEPUBの設定方法
「自炊」のはじまり• 書籍をスキャナーで読み込み電子化する方法を、通称「自炊」という
• 両面を一度に読めるドキュメントスキャナーの普及などが後押し
• 裁断機で本を裁断し、1枚ずつ読み込む
• 個人が書籍を裁断、1枚ずつスキャン?面倒だ!そこで業者に頼むことにした
「自炊」代行サービスの勃興
• 印刷所?などが自社の機器を活かし、書籍のスキャニングサービスを始める
• 1冊100円から、業者も多数あり
• しかしスキャンした本は捨ててしまう→著作権への配慮と思われる
自炊と著作権• テレビ番組の録画と同じく、書籍電子化は「個人の私的複製」となる筈
• 自炊代行業者は「個人」ではないので「個人の私的複製」に当てはまらない?
• 法律が時代について行けていない
• 「「自炊」代行、著作権使用料徴収で許諾検討」(2013年3月26日06時19分 読売新聞)
本を返却する業者
• スキャンした本を返してくれる業者もある
• ポリシーを持って営業しているようだが著作権的にはグレーゾーンの部分もある
• 260ページ、400dpi、OCR付き、裁断済み本の糊付け込みで3500円だった
• 基本250P迄800円+オプション
PDFからEPUBへ
• 自炊代行業者はスキャンした本をPDF形式に変換後、OCRで検索可能なPDFにもできる
• 日本語、特に縦書き、更に二段組の本はOCRの精度が低い
• OCRで9割ほど認識した後に手動で修正するのがよい
• PDFから抽出したテキストを元にEPUB化できれば電子本ストアで販売できる
EPUBとは• EPUB(イーパブ)は、電子書籍の規格の1つである。米国の電子書籍の標準化団体の1つである国際電子出版フォーラム (International Digital Publishing
Forum, IDPF) が普及促進している公開された仕様の電子書籍用ファイル・フォーマット規格である。
• Wikipediaより。http://ja.wikipedia.org/wiki/EPUB
EPUBの仕組み• 各章を構成するxhtmlと見た目を定義するcssをzipで固めただけ
• Apple iBooksは著作権保護機能などを独自に追加(EPUB非標準)
• まるで黎明期のHTMLを勉強しているようだ
• タグ手打ちで本の作成は面倒。優秀なツールの登場が望まれる
EPUB作成ツール(1)
• Mac OS X
• Apple Pages(1700円)
• 現状EPUB 2.0のみ対応
• Apple iBooks Author(無料)
• 電子教科書作りに特化。長文には向かず
• Adobe InDesign(料金まちまち)
• プロ用ツール。業者さんはどうぞ
EPUB作成ツール(2)
• Windows
• ジャストシステム 一太郎 2013 玄(16800円~)
• EPUB 3.0の縦書きにも対応
• マルチプラットフォーム(Mac, Linux, Windows)
• Sigil(無料。寄付歓迎)
• 上記いづれかのアプリで作成した後にタグを修正する場合、有効
EPUB 日本語独自の問題
• 縦書き
• EPUB3.0で縦書きに対応するも、Pagesで非対応
• ルビ
• HTMLと同じく<ruby>タグで対応しているらしいが今回は使わず
• 右綴じ
• content.opfファイルの設定で対応可能(後述)
今回のワークフロー
1. 紙の本をテキスト付きPDFにしてもらう(業者に頼む)
2. PDFからテキスト、画像を抽出
3. Apple Pagesで編集、EPUB出力
4. Sigilで開き直しタグを修正する(縦書き化)
縦書き、右綴じに修正する場合(1)
・Style0001.cssを修正body {
epub-writing-mode:vertical-rl;
-webkit-writing-mode:vertical-rl;
}
→縦書き、右綴じの意
縦書き、右綴じに修正する場合(2)
・各章を構成するxhtmlにcssを読み込む旨、明示的に指定<head>
<link href="../Styles/book.css" rel="stylesheet" type="text/css" />
</head>
縦書き、右綴じに修正する場合(3)
・content.opf
<package xmlns="http://www.idpf.org/2007/opf"unique-identifier="BookId" version="3.0" xml:lang="ja">
→version属性値を3.0に変更、xml:lang="ja"属性追加
<spine page-progression-direction="rtl" toc="ncx">
→page-progression-direction属性追加
ページ開きは右から左(Right To Left)の意
まとめ• 自炊は面倒なので代行サービスを利用していきたい
• 「自炊代行」を著作権法違反とするのは時代遅れ(著作権料二重取りしたいだけ)
• 自炊は過渡期の技術。原稿自体がが電子データなら自炊も要らない
• EPUB、特に日本語特有の問題に関してはツールが未成熟
• これから大手電子本ストアに公開するところまで体験してみたい