ScanSnapで電子書籍化してみる

よくよく考えたら、自分の身分はまだ学生で、

  • 研究室にScanSnapがある
  • 印刷室に裁断機がある

という、超恵まれた環境だったので、早速、書籍の電子化に取り組んでみようと思った。

まず、最初に取り組むことにしたのは、組込みシステム特論で配られた講義資料。これは組込みシステムについて知るにはとても良い資料なのだが、量も半端ではない。就職先は組込み系の会社ではないので持って行きたくはないが、いざというときがあったときのために残しておきたい。ということで、この講義資料に手を付けた。

まず裁断機。印刷室にあった手動裁断機はもう刃がさびていたが、上から半分裁断し、180度回して残り半分裁断というのを、慎重にやれば何とかできた。

次に、ScanSnap。基本的に自動で回転とか、濃度調節とかしてくれるのだが、これを「回転しない」「白紙ページを取り除かない」「フルカラー一択(モノクロ資料だけど)」にすれば、上手く読み取ることができた。勝手に回転を読み取って、何故か前後逆のPDFができたりしたが、手動設定で問題なし。ScanSnapで50枚くらいの資料なら問題なく一発で読み込まれる。そしてそのサイズも一つ20M程度のPDFで済んだ。

その次に、PDFをOCR化。これはScanSnapに付いていたソフトでやってみたが、あまり精度は良くない様子。スキャンよりもOCR化の方がずっと時間がかかる。

これで講義資料がPDFに早変わり。思ったより時間はかからないが、とにかく”かかりきりになる”ということだ。研究しながら、がちょんがちょんさせていればいいや、と思っていたら、どの作業も最大5分程度しかかからないので、ほぼかかりきりになってしまった。

ということで修論が終わったら本格的にScanSnapを大学の資料を残すために(個人的に)使う予定だ。