読者です 読者をやめる 読者になる 読者になる

あとーすログ

言葉と文芸とインターネット

【調査&執筆に10時間】芥川賞を受賞するまでの平均候補回数がどのくらいかを調べる記事を書きました。

ブログ・メディア運営

一昨日から昨日にかけて、「芥川賞受賞までの平均候補回数はどのくらい? 実際に調べてみました!」という記事のための調査と、記事執筆をしていました。

この記事のタイトルにもある通り、実質的には調査と執筆に10時間ほどかかってしまいました。

taskeyu.me



以前このブログで書いた、同じような雰囲気の芥川賞作家と直木賞作家の学歴を調べる記事はそれぞれ3時間くらいで書き上げたので、とても時間がかかってしまいました…。

 

atohs.hatenablog.com

atohs.hatenablog.com

 

この記事ではは、芥川賞作家の平均候補回数を調べる上で大変だったことをメモしておこうと思います。

気合で調査系の記事を書く人の参考になればと思います…!

 

ひたすら情報をスプレッドシートに入力する

今回の調査にあたっては、「芥川賞のすべて・のようなもの」というサイトを使用させていただきました。

芥川賞のすべて・のようなもの

ここに過去の芥川賞受賞作家と候補作家の情報はすべて集約されているのですが、誰が何度候補になって、何度目の候補で受賞しているのかをまとめている資料はもちろんありませんでした。

 僕は気合で調査系の記事執筆は好きなのですが、なるべく無駄なことはしたくありません。

いかに効率的に、データベースの形として情報を蓄積できるか考えた結果、「全回分の候補者と受賞者のデータを打ち込むのが一番効率的だ」という結論に至りました。

とても時間がかかることは最初から目に見えていました。他に効率的な方法があったら、マジで今後の参考にしたいので教えてください…。

 

スプレッドシートには、こんな感じで打ち込んでいきます。

f:id:ATOHS:20150727234537j:plain

これで2回分。「候補&受賞」以外は全て手打ちです。「名前」のところは、面倒臭い名前が出てきたときだけコピペしてました。

「候補&受賞」のところはE2に「=countif(B:B,B2)」と打ち込み、フラッシュフィルで一番下まで持って行きました。

細かい話ですが、「候補」の文字も一回打ち込んだらあとはフラッシュフィルしてました。でも、候補者が少ないと、手打ちでした方が早いんですよね…。

こうすると、「候補&受賞」のところに、受賞回も含めた総候補回数が表示されます。

本当は「”その時点までの"候補&受賞」にしたくて、

「=countif(B2,B2)」→「=countif(B2:B3,B3)」→「=countif(B2:B4,B4)」→…→「=countif(B2:Bn,Bn)」

みたいにしようと思ったのです、フラッシュフィルで実現できなかったので、諦めました。これもやり方分かる方がいれば、是非教えてください!

 

打ち込みだけで、だいたい5時間くらいかかったと思います。

打ち込み完了後、データを処理する

芥川賞は、一度受賞すればもう候補になることはないので、シートにフィルタをかけて「受賞/候補」のところで「受賞」だけを表示するようにし、「候補&受賞」の数字を見れば、何度目の候補で受賞したのかが分かります。

その後、「候補&受賞」を降順で並べ、「No.」と「名前をコピペして別のシートに貼り付けます。

「受賞/候補」はそのまま貼り付けると変な感じになっちゃうので、コピーしたら「特殊貼り付け」→「値のみ貼り付ける」で貼り付けます。そしてラベルを「候補回数」に変更しておきます。

こんな感じ。

f:id:ATOHS:20150728010218j:plain

これはもうすでに処理した後の画面ですが、「候補回数」のフィルタで降順に並べれば、候補回数毎に整列してくれます。

それで、こんな感じの表を作ります。

f:id:ATOHS:20150728010440j:plain

人数は、「候補回数」列をcountifで数えて、割合は単純に人数/総計出しています。

ちなみに、taskey Uの記事でも触れていますが、当初の疑問「芥川賞受賞までに平均何回候補になるの?」の答えは、2.0回でした。

 

受賞していない人の記録も知りたくなってしまった。

ここまでで当初の目標は達成したのですが、記事ボリューム的に少しさみしい感じ…。

そこで、受賞に至っていない方々の記録も調べてみることにしました。

しかし、これが予想以上に大変。いや、本当は大変じゃないのかもしれませんが、僕のやり方が大変でした。

 

受賞した人を全て抜き出すのは、「受賞/候補」で「受賞」だけを表示するだけでOKでした。そしたら、受賞した回のデータだけが出てきます。

ところが、「候補」になったことがない人の抜き出しはそうはいきません。単純に「候補」だけを表示させて「候補&受賞」を降順で並べると、以下の画像のようになってしまいます。

f:id:ATOHS:20150728011310j:plain

ちょっとマシにしようと思って「名前」を昇順で並べたあとで「候補&受賞」を降順で並べたところで、以下の画像のようになります。

f:id:ATOHS:20150728011440j:plain

セルが重複している場合に、そのセルが含まれる行を1行だけ残す方法とかあるのでしょうか…? とにかく僕には分からなかったので、残された道は2つ。

①データから、1人につき1列を抜き出す。

②データから、1人につき1列以外を削除する。

 

①を使うと、スクロールで上から下への大移動となってしまうので、②を選択しました。

別のシートにそのまんまコピペして、こんな感じで地道に消していきます。

f:id:ATOHS:20150728011757j:plain

お気づきの方もいらっしゃるかもしれませんが、そのまま消してしまうと、上の画像のように、データを消した段階で全ての方の「候補&受賞」が「1」になってしまいます。

そうならないように、コピペするときに「候補&受賞」は「値のみ貼り付け」にしておきます。

すると、他のデータを削除しても、候補回数が残ります。

ちなみに僕は、この間違いに途中まで気づかず、30分くらい時間を無駄にしました…。

 

これをやっていると、途中で受賞経験のある方のデータも出てくるので、そのときはその人の分を全部消去します。

もしも残っていたとしても、それは最新の候補回→受賞回なので、最後に1度目で受賞した方々とともに「受賞/候補」で「受賞」だけを表示して、そこに表示されているデータを全て削除すればOKです。

 

あとは、空白行ばかりのデータだと使いづらいので、C列の「候補」のフィルタで「(空白)」からチェックを外します。

E列の「候補」のフィルタで、降順に並べてもいいかもしれません。

(なんでC列とE列同じ名前にしてるんだろう…?)

すると、こんな感じになります。

f:id:ATOHS:20150728012421j:plain

 

完璧!書くだけだと簡単に見ますけど、データを削除する作業で1時間くらいかかったような気がします。ガリガリ精神力削られます。

 

あとは、受賞者と同じように表を作るだけです。

f:id:ATOHS:20150728012943j:plain

 

あとはこのデータを元にして、記事を書くだけでした。

構成を考えるのに手間取って執筆にも少し時間がかかりましたが、調査時間に比べればなんてことはありませんでした。

 

つらかったこと

この記事を書く上でつらかったことをまとめたいと思います。

 

まず、なんといってもデータ入力がつらい。軽い気持ちで始めたのですが、最終的にはのべ1069名分のデータを入力しました。この作業のおかげで、正確にタイピングする能力が少し向上したような気がします。めちゃくちゃめんどくさかったです。

 

次にめんどくさかったのが、上にも書きましたが、受賞に至らなかった方々のデータを消す作業です。入力する以上に単純作業感が強いので、時間はそれほどかかりませんでしたが、つらいことはつらかったです。

 

そして地味にめんどくさかったのが、記事に受賞者と候補者一覧を記す作業。

分かりにくいと思うので、説明します。

記事では、こんな感じで受賞者と候補者の一覧を、候補回数毎に掲載しています。

f:id:ATOHS:20150728014144j:plain

 

これはもちろん、スプレッドシートの一覧から名前だけをコピペして貼り付けてるんですけど、編集画面に貼り付けると、こうなってしまいます。

f:id:ATOHS:20150728014509j:plain

 

このまま公開すると、スクロールが大変すぎるので、名前の間に読点を打って、延々横に並べていく形式にします。

よく考えたら置換を読点に置換したら良いんじゃね?改行って置換できるかわかんないけど、できそうじゃね?と思ってぐぐったらWordでできるみたいですが、見なかったことにします。

okwave.jp

 

僕のやった方法は、テキスト編集画面の右いっぱいのところにカーソルを置き、

「読点を打つ」→「Enterで確定」→「Escで改行を削除」→「クリックでカーソルの一を移動」→「読点を打つ」→…

を繰り返すというものでした。この作業のおかげで、Escをノールックで押せるようになりました。今後全く役に立ちそうにない技術です。

 

…ちなみに、さきほど見なかったことにした方法を使うと、一瞬で改行が読点に置換されました。今後同じような検証をするときは、積極的に利用していこうと思います。

 

まとめ

思いつくままに作業内容を書いてみたら、本編と同じくらいの長さになてしまいました。

この記事は誰の役に立つのだろう…と考えたのですが、まあ冒頭にも書いたとおり、僕みたいに気合で調査する記事を書く人の役に立つことができれば嬉しいです。

ところで、今回の調査で当ブログの純文学作家には高学歴の人が多いの?→芥川賞作家153人の学歴を調べてみたの人数が4人足りないことが判明したので、後日修正したいと思います…。

 

この記事はあくまでもおまけですので、皆さん、taskey Uの本編の方を是非お読みください…!

taskeyu.me