トップ会長挨拶医師会事業計画活動内容医師会報地域包括ケア介護保険について月間行事予定医療を考える集い学校保健関連

<ペンリレー>

発行日2018/11/10
くらみつ内科クリニック  倉光 智之
リストに戻る
臨床データまとめの回想
 
  臨床研究で一番労を要するのはなんと言ってもデータの打ち込みである。正確なデータの打ち込みが済めばゴールは見える。昔は膨大な数のカルテを机に積んで何日もかけてデータの打ち込みをしたものであった。
  苦労して打ち込んだデータの生かし方を実感したのは、SPSS、SASという多変量解析ソフトとの出会いであった。もう20年以上も前のことである。それまではMann-WhitenyのU検定、Fisherの正確検定、Kaplan-Mayer法とログランク検定までで精一杯であった。今では多変量解析は当たり前の手法となっているが、私が知った頃はまだ学会でもオッズ比やハザード比という言葉はあまり目にすることはなかった。統計学の本を多数買いそろえ、単変量・多変量回帰分析やコックス比例ハザード法を独学し、試行錯誤の中、強制投入法、ステップワイズ変数増加法・変数減少法などいろいろ試してみた。解析ソフトは一瞬にしてオッズ比あるいはハザード比などを計算し有意な因子を抽出する。
  多変量解析を使った演題を初めて学会で発表した時は、統計手法に質問が来たらどうしようと不安でいっぱいであった。治療効果に寄与する因子の解析を行ったとき、従来言われていた因子の他に、女性、LDLC低値が難治因子として抽出された。当時はそのようなことは言われておらず、しかもわずか数十例の検討では自分の解析結果が正しいとの自信は持てなかった。“結果はこのように出たが、症例数が少なく更なる検討が必要である”と結論は無難にまとめた記憶がある。その演題の座長をした高名な先生が発表後に、“実はうちの施設でも多変量解析したら女性が効きにくいという結果が出たんだよね、先生のところでも出ましたか、もしかしたら正しいのかもしれませんね。”、と話したのを今でも覚えている。それから程なく女性が効きづらく、LDLCが高い例は効きやすいということは常識になった。
  私はこの一件で多変量解析のすばらしさを実感した。当時の学会発表では、まず症例数の多いことが先駆的施設の絶対条件で有り、全国レベルの施設に比べ1桁症例数が少ない我々の病院は全くかなわなかった。多変量解析は症例数が少ない事をカバーできるツールとなった。多変量解析という手法を得たことで、その後学会で多くの発表を行う機会を得た。現在ではEZRというすばらしいフリー統計ソフトがあり、若いDrはこちらを使用しているらしい。
  12年前に開業して、電子カルテを使用するようになってから、個々の採血データをエクセルにエクスポートできるようになった。手打ちであったデータの打ち込みが不要になったのは画期的であった。それまでは、ファイルメーカーにデータを打ち込み、SPSS、SASに読み込ませて解析するパターンが主で、エクセルはグラフ作成に使うだけであった。急にエクセルが身近になり、インターネットで使い方を検索しながら付き合うことになった。私にはプログラミングなど専門的知識はない。
  こういうことを抽出したいとインターネットで検索するとすぐほしい関数を探すことができた。便利な時代である。エクセルの関数を使うと、延べ人数から実人数を計算できることがわかった。A列がID番号の場合、最終セルに“=SUMPRODUCT(1/COUNTIF(A2:A500,A2:A500))”と関数を設定すると、A2-A500のセル内の実人数が数字で表された。これは2行目から500行目に何回同じIDが出てくるかで計算している。例えば3回同じ患者のデータがあれば1/3が数字として返される。5回あれば1/5が返され、1回であれば1が返される。総和がすなわち実人数になるのである。最近エクセルにピポットテーブルという機能があることを知った。関数設定は全く不要で、あっという間にクロス表が作成され実数が計算される。これは極めて優れものである。1度お試しあれ。
  エクセルでは空白のセルがあると計算がうまくできず、その都度削除していた。エクセルにCOUNTIF、COUNTIFSというすばらしい関数機能がある事を知った。これを使用すると、0より大きな数字のみ、あるいは男性のみ、60歳以上など、条件をつけることができ、データ削除や並び替えなどせず症例の絞り込みができた。複数行を検討する場合は配列数式と呼ばれる方法が必要となる。関数の上で[Enter]+[Ctrl]+[Shift]を同時に押すのであるが、関数が{ }で囲まれる。例えば、全内視鏡検査の群から、各々の患者の内視鏡最終検査日を計算する場合、A列にID番号、E列に検査日があるとすれば、10行目にあるID患者の内視鏡最終検査日は{=MAX(IF($A$2:$A$500=A10,$E$2:$E$500))}となる。そのID患者の最後に受けた内視鏡の種類(経鼻か経口か)は、O列に計算された内視鏡最終検査日、D列に内視鏡の種類を入れておくと=IF(AND($A$2:$A$500=A10,$E$2:$E$500=O10),D10,"")で計算される。ほしいデータの抽出は工夫次第でいくらでも可能である。しかも計算で出たデータは多変量解析と違い、正しいかどうかを検証できる。コンピューターに詳しい方では当たり前のことなのだろうが、今まで力仕事でやっていたことがあっという間に完璧に計算されることは感動の連続であった。
  検査項目のデータシートを作成のコツは最近会得した。今まではいつも患者のデータシートから数字をコピーペーストして作成していた。リンクしてコピーをするとどうしてもずれることがあった。そこで知ったのが$の使い方である。$C$2と規定されたデータは位置を変えて何度コピーしても引用セルが動かない事がわかった。エクセルに詳しい方には基本中の基本と思う。上に記載した内視鏡に関する式の中に$が入っていたのもコピーしたときに条件が動かないようにするためである。その後、置換機能が応用できることを知った。現在、臨床経過をまとめる場合、一番時間を割くのは患者のデータシートの雛形の作成である。全ての患者において何行目何列目に同じ条件のデータが入るように作成する。例えば10行目はPlt、11行目はALT、そして3列目は治療後12週目のデータ、5列目は治療後24週目のデータのようにである。 
  検査項目のデータは個々人のデータをリンクペーストして作る。検査項目シートに、平均値、最大値、最小値、中央値などを入れるときもすべて数式で入れる。検査項目シートを数式の表示にすると、実数の入ったセルは一つもない。このようにリンクで作成されたPltシートを1枚作成すると、$10⇒$11で全て置換にすれば、あっという間にPltのシートがALTのシートに変わる。患者データシートの雛形に入っている項目であれば、どの項目でも瞬時に必要とする検査項目のシートに変換することができる。経時経過グラフ作成もあっという間である。ものすごい時間短縮かつ正確な仕事になる。エクセルの能力に日々驚嘆している。臨床データのまとめ方も随分変わり、エクセル様様である。
  次は、その博学にいつも驚かされている、秋田厚生医療センター糖尿病内科の下斗米孝之先生にお願いしました。
 
 ペンリレー <臨床データまとめの回想> から