医療の「エビデンス」とはそもそも何なのか？適切な医療や健康情報を手に入れ、活用するために必要なヘルスリテラシーとは

〈うつ病の再発率が60％といわれる根拠は？「この薬で死亡率が3倍」といったセンセーショナルな表現や情報は誤りである可能性が高い理由〉から続く

医療の定説や広告、健康食品の成分表示など、「情報」の正誤や信頼性を見極めることは、自らの健康を守るための意思決定において重要なことである。

正確な医療情報へとアクセスするにはどうすればいいのか、エビデンス研究の専門家である医師が書き下ろした書籍『その医療情報は本当か』より一部を抜粋・再構成し、解説する。

医療のエビデンスは「臨床研究」の結果から得られる

エビデンスとは、「証拠・根拠・証言」という意味です。医学分野に限った専門用語ではなく、現在ではさまざまな分野で情報に対して求められています。とくに科学の分野では重視されていて、エビデンスとは「医学的根拠」や「科学的根拠」を表すことばとして使われます。

医学の場合、たとえば、「喫煙している人は喫煙していない人と比べて、肺がんになるリスクが何倍になるのか」とか、「うつ病の患者さんが抗うつ薬を服用することで、何人中何人がよくなるのか」など、特定の病気や症状に有効な治療法を報告するときに、ヒトを対象とした「臨床研究」の結果を示します。

その研究結果からエビデンスが得られ、医療者の間では、「患者さんにエビデンスを示して治療法を説明する」などと表現されます。実際に、臨床研究は医学的なエビデンスを構築する作業となります。

「エビデンスレベル1〜6」のそれぞれの基準

次に、エビデンスレベルの基準について、具体的に見ていきましょう。

治療の有効性に関するエビデンスは、「信頼性がもっとも高いレベル1」から、「信頼性がもっとも低いレベル6」まであります。レベルが低い順から、研究デザインの種類を示して説明します。

〈エビデンスレベル6〉
実際に検証されたデータに基づいているかどうかわからない「専門家の意見」。

たとえば、医学専門誌やテレビ番組などで医師や専門家が、「わたしの長年の経験で実感しているのですが、○○の症状には、△△の治療法が有効です」と発言したとしましょう。この場合、発言者が医師であっても「個人の経験・見解」であり、その治療法にどの程度の医学的根拠があるのかはわかりません。そのため、信頼度はもっとも低いレベル6に分類されます。

〈エビデンスレベル5〉
珍しい疾患や新しい治療法で効果があった場合に、医学論文や医学会で発表される「△△の薬によって○○の症状に改善がみられた」という「症例報告」。

症例報告とは、実際に患者さんに対してある治療を行ったことでどうなったかの経過報告であり、専門家たちが共有し、さらなる研究を進めるうえで重要な情報となります。

ただし症例報告は、その人にはその治療法が有効であったとしても、「もしその治療を行わなかった際にはどうなっていたのか」といった、研究にとってもっとも重要な、「治療をした場合としなかった場合の結果の比較」ができていない段階です。

その治療を行っていなくても、自然に回復していたかもしれず、また、その治療をしなかったほうが早く改善していたかもしれません。そのため、症例報告はレベル5に分類されます。

〈エビデンスレベル4〉

「症例対照研究（後ろ向き研究）」や「コホート研究（前向き研究）」など。

症例対照研究は、ある病気を発症した人と発症しなかった人のそれぞれの生活習慣や基礎疾患の有無などを、カルテなどの記録から過去にさかのぼって調査し、病気の要因を見つける方法です。

時間軸をさかのぼって研究するため、「後ろ向き研究(retrospective study)」とも呼ばれます。「後ろ向き」とは、考えかたが消極的だとか、物体の後ろ側が見えているといった意味ではありません。たとえば、「心筋梗塞と喫煙歴の関連性について、心筋梗塞になった人とそうでない人について、カルテを過去にさかのぼって調べて、喫煙歴を比較する」といった研究方法を指します。

一方、「コホート研究(cohort study)」のコホートとは「大きな集団」を指し、まだその病気にかかっていない多数の人を集めて、現在から未来に向かってデータを収集します。この研究方法では、どのような要因や特性を持つ人が発症するのかを長期にわたって追跡し、分析します。時間軸に沿って研究するので、「前向き研究」と呼ばれます。

たとえば、「喫煙している人と喫煙していない人を、数年から数十年にわたって追跡し、心筋梗塞の発症率を比較する」といった研究の方法をいいます。

世界的に評価が高いことで知られる日本のコホート研究に、1961年から九州大学が実施している「久山町コホート研究」が挙げられます。福岡県の久山町で、住民を対象にした脳卒中、虚血性心疾患、認知症、慢性腎臓病、高血圧、糖尿病、胃がん、大腸がん、ゲノム疫学、眼科、心身医学などの疫学調査が行われています。

後ろ向き研究と前向き研究では、同じレベル4であっても、「コホート研究（前向き研究）」のほうが信頼性は高くなります。後ろ向き研究でいざデータを集めようと思っても、そもそもデータがカルテなどに記録されていなければどうしようもありません。その点、前向き研究の場合はこれからデータを集めるので、正確に調べることができるからです。

また、「横断研究（cross-sectional study）」と「縦断研究（longitudinal study）」に分類することもあります。前者は、アンケート調査など、特定の集団に対してある一時点で調査する研究のことで、これもレベル4に含まれます。後者は特定の集団に対して長期間にわたって追跡調査を行い、データを収集します。前述の前向き研究、後ろ向き研究がこれに該当します。

〈エビデンスレベル3〉

「非ランダム化比較試験」を実施した研究。
非ランダム化を理解するには、先に「ランダム（random）化」（次の項目・レベル2の研究デザインのこと）とは何かを把握したほうがわかりやすいので、まず、そちらを説明します。

「ランダム化」とは、くじ引きなどを使ってグループを分ける方法です。まさにランダムに振り分けられ、恣意的にグループ分けを操作することができません。一方、「非ランダム化」とは、そこまで厳格には分けない方法のことです。たとえば、カルテ番号を偶数と奇数で分けるとか、来院の順番に交互に振り分けるなどです。

このように、ランダムなグループ分けをせずに実施された「非ランダム化比較試験」の結果は、ランダム化比較試験より信頼性が低くなるため、レベルがひとつ低いレベル3として分類されます。

〈エビデンスレベル2〉

「ランダム化比較試験」を実施した研究。
たとえば、新しい薬の開発をする際、その薬を「使うグループ」と「使わないグループ」とに、くじ引きやコンピューターでランダムに分けて、グループごとの効果の違いを検証します。

ランダムに分けることで、結果に影響を与えそうな背景や要因を両グループで均等にすることができて、平等な比較が可能になります。

また、被験者が「自分は新薬を服用している」と認識している場合、実際の治療効果とは関係なく改善することがあります。そのため、効果はないけれど見た目はまったく同じプラセボ薬(偽薬)を使って、どちらを服用しているかわからなくすることがあります。これを「盲検化（ブラインド化）」といいます。

このランダム化比較試験ではもっとも正確に効果が検証できるため、新しい薬を開発する際の「治験」では必ず行われます。治験とは、ヒトを対象に、新しい薬や治療法の効果、また安全性を科学的に調べる臨床試験のことです。

製薬会社は「くすりの候補」を用いて国の承認を得るために治験を行い、研究結果を集めます。その治験は省令に定められた要件を満たす病院のみで行われます。

〈エビデンスレベル1〉

「システマティックレビュー（系統的レビュー）」と「メタアナリシス（メタ解析）」。

ひとつのテーマに対して、世界中で複数のランダム化比較試験が行われています。しかし、それらの結果は必ずしも一致していません。たとえばある薬の有効性に関して、A大学での研究では有効で、B大学の研究では無効といった結果になることもあります。これでは、どうしていいか答えが出ません。

そこで一定の基準を用いて、同じテーマの研究を徹底的に探し出して系統的に批評や再検討する「システマティックレビュー」や、さらに、個々の研究の結果を統計学的な手法で合体させ、数値で表す「メタアナリシス」という方法によって結果を得ます。それがエビデンスの信頼性がもっとも高いレベル1です。

ある治療法が開発されたとします。そうすると、世界中でその治療法についてのさまざまな臨床研究が行われます。そしてそれらから無数のエビデンスが得られます。

では、どういう状態になればもっとも信頼できるのかと問われると、レベル2のランダム化比較試験が複数実施されて、それらを統合したシステマティックレビューやメタアナリシスが行われ、その結果が得られていること、と言えます。それゆえに、この結果がレベル1となるのです(図9)。

レベルが高いから正しいのか？

ただし、エビデンスレベル1の情報であっても、さらに新しい別のランダム化比較試験の結果が出ると、それを含めて研究を更新する必要があります。システマティックレビューやメタアナリシスの結果にも「賞味期限」があり、将来にわたってそのエビデンスが正しいことを保証するものではありません。

重要な考えなのでくり返しますが、「エビデンスレベル1であっても絶対的にそれが真実だと保証できるものではない」ということも頭に入れておきましょう。

ここまでみてきたように、エビデンスのレベルは、研究デザインの正確さの順番に6つに分類されてはいますが、レベルが高いから正しい、あるいは、低いから間違っている、ということを示すものではありません。

＊１ Guyatt GH. Evidence-Based Medicine [editorial]. ACP Journal Club. 1991:A-16. （Annals of Internal Medicine; vol. 114, suppl. 2）.

写真／shutterstock

11/21 18:30

集英社オンライン

元記事を読む

記事に関連するキーワード

健康・病気

情報提供元の記事

ジャンルで探す

au WebポータルTOPへ

医療の「エビデンス」とはそもそも何なのか？ 適切な医療や健康情報を手に入れ、活用するために必要なヘルスリテラシーとは