目次
無料で論文管理を始めるなら、まずは形を決めるのが大事だった
収集した論文をきちんと管理したいと思い、無料で使える文献管理ソフトを調べた結果、今回は JabRef を使ってみることにしました。
候補としては Zotero も有力でしたが、僕はまずローカルにデータを置いて管理したいと考えていました。さらに、文献情報を .bib ファイルとして扱えること、後から見返したときに構造が分かりやすいことを重視すると、JabRef はかなり相性が良さそうに見えました。
実際に触ってみると、最初は分からない用語も多かったものの、一つずつ意味を理解しながら進めれば、初心者でも十分導入できると感じました。今回は、JabRef を導入して、最初の論文を登録できる状態まで整えた流れをまとめておきます。
JabRef を選んだ理由
今回重視したのは、クラウド前提ではなく、ローカル保存を軸にして管理できることでした。
JabRef は、文献情報を .bib ファイルとして保存します。つまり、論文の一覧や著者名、タイトル、年、PDF の関連付けといった情報が、専用の見えないデータベースの中だけではなく、BibTeX の文献ファイルとして残ります。この点がかなり分かりやすく感じました。
僕の中では、
PDF は論文の本体.bib は論文情報の台帳
JabRef はその両方を結びつける管理ソフト
という理解です。
この構造なら、ローカル管理がしやすいですし、あとからバックアップや移行を考えるときにも扱いやすいです。さらに、オープンソースで、自分用に設定を調整しやすい点も魅力でした。
最初に作ったフォルダ構成
まずは、Windows の Documents 配下に論文管理用のフォルダを作りました。
PaperLibrary という親フォルダを作り、その中に pdf と inbox を用意しました。
pdf は整理済みの PDF を置く場所、inbox はまだ整理していない PDF の仮置き場です。最初はこの程度の単純な構成で十分だと感じました。
ここで大事なのは、実フォルダを最初から細かく分けすぎないことだと思います。物理的なファイルの置き場はできるだけシンプルにして、分類は JabRef 側で行うほうが分かりやすいです。
.bib ファイルの意味を理解した
JabRef を使い始めるうえで、最初に少し引っかかったのが .bib という拡張子でした。
これは PDF のような論文本体ではなく、文献情報を保存するためのファイルです。たとえば main.bib というファイル名なら、その中に著者名、タイトル、年、雑誌名、DOI、PDF の保存先などが記録されていきます。
最初は少し身構えましたが、理解してしまえば難しくありません。要するに、論文の本体と、その論文に関する情報を分けて管理しているだけでした。
この理解ができてから、JabRef の構造がかなり見えやすくなりました。
最初に入れた設定
新しいライブラリとして main.bib を作成したあと、いくつか基本設定を入れました。
まず、文字コードは UTF-8 にしました。これは日本語が文字化けしにくい形で保存するための設定です。
次に、Library mode は BibTeX にしました。JabRef には BibTeX と biblatex という選択肢がありますが、最初は BibTeX で十分だと判断しました。
さらに、PDF の保存先として ./pdf を設定しました。これは、main.bib がある場所を基準にして、その隣の pdf フォルダを PDF の置き場として使う、という意味です。相対パスで設定しておくと、フォルダごと移動しても崩れにくいのが良いところです。
また、citation key の既定パターンは [auth][shortyear] にしました。これは著者名と年の下二桁を使って、Yamada24 のような短い識別子を自動で作るためのルールです。LaTeX を使う場合にも扱いやすそうだと感じました。
最後に、保存時の整形機能も有効にしました。これによって、保存時に表記の揺れを少し自動で整えてくれるようになります。
日本語化できたことでかなり使いやすくなった
JabRef は日本語化もできました。これが思った以上に大きかったです。
最初は英語の項目名に戸惑う場面もありましたが、日本語表示にしてからは設定の意味がかなり追いやすくなりました。初心者が最初に慣れるという意味でも、日本語化はかなり有効だと思います。
もちろん、細かい部分では英語の名残があったり、説明を調べると英語の情報に当たったりすることもあります。それでも、日常運用のしやすさは大きく変わりました。
最初の論文登録で分かったこと
試しに、ハドヴィガー・ネルソン問題に関する 2018 年の論文を登録してみました。具体的には、Aubrey de Grey による、平面彩色数の下限を 5 に押し上げた論文です。
最初は PDF を inbox に入れ、その PDF を JabRef にドラッグ&ドロップして取り込みました。ここまでは簡単でしたが、登録された情報を見てみると、著者名や年が崩れていました。
種類が InProceedings になっていたり、年が 1804 のようになっていたりして、明らかにおかしかったのです。PDF からの自動読み取りは便利ですが、必ずしも正確ではないことがここで分かりました。
特に arXiv の PDF では、このような崩れ方が起こることもあるようです。
自動読込をそのまま信じないことが大事だった
このとき学んだのは、PDF を取り込んだあとに、最低でも
著者
タイトル
年
の三つは確認したほうがいい、ということでした。
自動読込でそれらしく登録されても、実際には壊れていることがあります。最初は何が正しい状態なのか分かりにくいのですが、少なくとも著者名や年が不自然なら、そのまま使わないほうが安全です。
便利な機能ほど、そのまま鵜呑みにしないことが大切だと感じました。
arXiv ID から作り直したら正しい情報になった
今回は PDF から読み取った壊れたエントリをそのまま直すのではなく、arXiv ID を使って正しいエントリを作り直しました。
対象の論文は arXiv 上で公開されているので、ID を指定して生成したところ、
著者
タイトル
年
要旨
がきれいに入った正しいエントリができました。こちらは Article として登録され、著者名も de Grey になり、年も 2018-04 という形で妥当なものになっていました。
その後、この正しいエントリに対して PDF を関連付け、最初に自動読込された壊れたエントリは削除しました。
結果として、最終的に残ったのは、正しい文献情報と正しい PDF の関連付けを持つ 1 件だけになりました。
物理フォルダより、分類はグループでやるほうが良さそうだった
フォルダ管理についても考えましたが、実際に触ってみると、PDF を物理的に細かくフォルダ分けするよりも、JabRef のグループ機能で分類するほうが良さそうでした。
JabRef のグループは、実フォルダと違って一つの論文を複数の分類に入れられます。たとえば同じ論文を、
平面彩色数
SAT
未読
のように複数のグループへ入れることができます。
これはかなり便利で、論文を一つの観点だけで整理しなくてよくなります。つまり、物理ファイルはシンプルに保ち、分類は論理的に重ねる、という考え方です。この方針なら、あとから見返したときにも柔軟に扱えそうだと感じました。
今の時点での運用方針
ここまで試してみて、今後は次のような形で運用するのが良さそうだと感じています。
新しく入手した PDF は、まず inbox に入れる。
その後 JabRef に取り込む。
取り込んだら、著者・タイトル・年を確認する。
DOI や arXiv ID があるなら、必要に応じてそこから正しい情報を作る。
PDF は最終的に正しいエントリに関連付ける。
分類はグループで行う。
この流れなら、無理なく続けていけそうです。
触ってみた感想
最初は少し難しそうに見えましたが、実際には「何がどこに保存されているのか」を理解すると、一気に分かりやすくなりました。
特に僕にとって大きかったのは、ローカル保存前提で管理しやすいこと、日本語化できること、そして .bib という形で文献情報が見える形で残ることでした。
一方で、自動読込は万能ではないので、そのまま信じずに確認する必要があります。この点だけは、最初に知っておいたほうがいいと思います。
とはいえ、無料でここまでできるならかなり強いです。論文をきちんと管理したいけれど、まずはシンプルに始めたいという場合には、JabRef はかなり良い選択肢だと感じました。
まとめ
今回、JabRef を使ってローカルでの論文管理を始めるところまで進めることができました。
最初にやることは意外とシンプルで、
保存用フォルダを作る.bib を作る
基本設定を入れる
PDF を取り込み、情報を確認する
この流れを一度体験すると、全体像がかなり見えてきます。
今後はグループを活用しながら、研究や学習で使う論文を少しずつ整理していきたいと思います。まずは一件でも正しい形で登録してみることが、いちばん大きな一歩でした。
鯛焼ぷろじぇくと。Official Website