第8回 臨床試験(3) 「治験の総括報告書」(その2)
前回に引き続き、「治験の総括報告書」の後半、主に「治験の計画」「有効性の評価」「安全性の評価」について見ていきます(項目番号は前回の3.治験総括報告書の項目ごとの注意点からの続き番号です)。治験デザインや統計手法などの説明は「治験ナビ」(http://www.chikennavi.net/index.htm)の用語集や本ガイドライン本文、あるいはガイドライン「臨床試験のための統計的原則」(http://www.pmda.go.jp/ich/efficacy.htm)などを参照してください。
9) 治験の計画 (Investigational Plan)
「治験の計画」の項は、治験実施計画書(protocol)に基づいています。「治験の総括報告書」の翻訳に際しては「治験実施計画書」を参考にすると、かなり手間が省けます。
治験の計画は、それまでの非臨床・臨床試験の結果や問題点に基づいて目標を立て、望む結果が得られるようデザインを考えます。
その際、以下の項目を検討・決定し、治験計画の根拠や妥当性について、項目別に説明と考察を行います。
(1) 治験の目的(objectives): この治験で明らかにしたいこと、この治験の位置付け
(2) 治療法(treatment)、治験薬(study drug):治験薬 [被験薬(investigational drug)+対照薬(control)]、用法・用量(dose and dosage)及び投与経路(administration route)、治験薬の同定(外観、成分、含量の確認)
(3) 対照(control):比較対照の種類、例えば、プラセボ/無治療/実薬対照、被験薬の用量-反応を比較、など。
(4) 患者母集団(patient population)(年齢、性別、疾患、入院/通院、等)と計画症例数:目的とする評価が可能な例数、統計解析で有意差((significant difference)が証明できる例数を検討。治験への組み入れ基準(inclusion criteria)・除外基準(exclusion criteria)を決める。
(5) 治療群への患者の割付(assigning patients to treatment groups, patients allocation):無作為化*(randomization)、層別化**(stratification)など。
*無作為化(ランダム化):いくつかある治療法のひとつに被験者を無作為に割り当てる過程。恣意的に 特定の群に割り付けるバイアスを減らすことができる。
**層別化:性別、年齢、体重、人種、重症度等、治療に影響を与える要因を考慮した上で、無作為化する方法。
(6) 試験の構成:並行群間比較*/クロスオーバー**など。
*並行群間比較(parallel group controlled):各群同時並行に指定された期間の治療を行い、結果を比較。
** クロスオーバー(cross-over):交差試験、2群の被験者に被験薬と対照薬を交互に時期をずらして 投与し、結果を比較。
(7) 盲検化*(blinding/ masking)の水準と手法(非盲検(open-label)/二重盲検(double blind)/単盲検(single blind)の別、又は第三者の評価者が盲検で評価、など)
*盲検化:被験者や評価者が「割り付けられた治療法」を知っていることにより生ずる結果の偏りを防ぐための方法。「割り付けられた治療法」を誰が知っているかによって、盲検化の水準が決まる。すなわち、非盲検(被験者も治験責任/担当医師も割り付けられた治療法を知っている)、二重盲検(被験者も医師も知らない)、単盲検(医師は知っているが、被験者は知らない)、被験者も医師も知っているが、割り付けられた治療法を知らない第三者が評価、などがある。
(8) 前治療(prior therapy)及び併用療法(concomitant therapy)など。
(9) 主要評価項目(primary endpoint)と副次的評価項目(secondary endpoint):何をもって有効性や安全性の評価項目(エンドポイント)とするか。有効性と安全性の項目(efficacy and safety variables)として数値化又は評価尺度で表すことが望ましい。臨床検査(laboratory test)項目とスケジュール(評価日、投与時刻と測定時刻)、血中薬物濃度測定(drug concentration monitoring)の回数と間隔、安全性評価にかかわる有害事象(adverse event)データの収集方法と評価尺度(rating scale)及び報告方法を決めておく。
*エンドポイント:治療行為の意義を評価する評価項目。臨床検査項目、薬物動態(PK)パラメータや薬力学的(PD)指標、効果又は安全性の指標など、客観的に評価できるものをその解析方法とともに予め設定しておき、評価対象とする。
(10) 全ての治療期間(duration of treatment)の順序と長さ
(11) 統計手法(statistical method)及び症例数(sample size)の決定:解析(statistical analysis)、比較(comparison)、検定(test)の方法を決める。被験薬と対照との比較に用いる特定の測定値(測定時点、測定回数、治験完了時など)、基準値(baseline response)からの変化、生命表解析(life table analysis)などのいずれを用いるか、決める。解析除外症例の基準を示し、また、計画症例数とその設定根拠について、統計学的な考察や実施上の制限(群間の差が検出できる、あるいは見込まれる患者数が少ない、など)などを記述。
(12) データの品質保証:このような計画に従って行われる治験データの品質保証(quality assurance)及び品質管理(quality control)の方法(治験の信頼性に関わる)。
(13) 安全性評価委員会、データモニタリング委員会等を設けるか
(14) 中間解析(interim analysis)を行うか否か、行うなら、その根拠
それではここで例題を訳してみましょう。ある新薬TOP015(仮名)の第I相試験の「治験の目的」です。この新薬は新規成分topotopoline(仮名)と既存の市販成分yorovin(仮名)との配合剤として開発中で、この試験は、配合剤である新薬TOP015のバイオアベイラビリティを、topotopolineとyorovinの単剤を併用した場合と比較検討することを主要目的としています。
例題1 原文
Study purpose
This study is designed to determine the relative bioavailability of the fixed combination of 100/5 mg topotopoline/yorovin (TOP 015) tablet relative to the free combination of the final market form of 100 mg topotopoline tablet and the 5 mg yorovin market tablet. The 100 mg dose of topotopoline and 5 mg dose of yorovin are used because they will be used in the upcoming clinical trials. And this study is to assess the safety/tolerability and PK of TOP 015 in Japanese healthy male subjects. This study will provide the data necessary for Japanese Ph3 studies.
例題1 訳
治験の目的
本治験は日本人健康男性被験者に対して,topotopoline 100mgとyorovin 5 mgを含有する配合剤のバイオアベイラビリティを、topotopolineの市販予定製剤(100 mg)にyorovinの市販製剤(5 mg錠)を併用投与した場合と比較検討することを目的としている。topotopoline 100 mg及びyorovin 5 mgは今後の臨床試験の予定用量である。また、本治験では日本人の健康男性被験者における安全性及び忍容性,並びに薬物動態を確認する。本治験は,日本人における臨床第III相試験計画に必要なデータを提供すると考える。
この例では配合剤のバイオアベイラビリティを単剤併用と比較することが主要評価項目であり、副次的評価項目は日本人の健康男性被験者における安全性と忍容性、及び薬物動態の確認です。服薬の簡素化をねらって配合剤が開発されますが、そのバイオアベイラビリティは必ずしもその配合成分の併用時と同じではありません。含まれている基剤や添加剤が異なるため、溶解、吸収、分解等が変わってくるためと考えられます。
さて、ここからは治験の結果に関する記述です。、結果の記述方法も一部治験実施計画書を踏襲します。有効性や安全性の結果は文章及びガイドラインの別添IIIb~VIIのような表で表されます。
10) 治験対象患者(study patients)
治験に組み入れた全患者の内訳(無作為割付した患者数、組み入れ患者数、治験の各スケジュールを完了した患者数)、無作為割付後の中止理由(追跡不能、有害事象、服薬不遵守)などを略述し、図又は表(ガイドラインの別添表IV~V参照)を添付します。
治験の組み入れ又は除外基準、治験実施方法、患者管理又は患者の評価に関する重要な逸脱(deviation)についても記述します。どのような患者を何名治験に組み入れたか、そのうち何名が治験を完了し、何名がどのような理由で中止したか、ということは解析の基礎として重要です。
ここで、患者数(number of patients)と症例数(number of cases)について、一言。日本人の記述では、この2つが区別されていない場合が多いが、英語ではpatientはあくまでも人格をもった一人の人であり、caseは一人の患者の経過や転帰を表す「例」にすぎません。日本語で「30例が治験に参加した」とあっても、その英語は”Thirty patients participated in the study”であって、Thirty cases…ではありません。治験に参加するのは「人」であって、caseという「物」は参加できないからです。しかし、統計解析で治療経過のある時期をとりあげて、その期間での改善例が何例という場合はcasesとなります。英訳では特に要注意。ちなみにガイドラインの別添IVa~VIIの表では、日本語はすべて「患者」、英語もpatientとなっています。
11) 有効性の評価 (efficacy evaluation)
有効性も安全性も評価はすべて「治験の計画」で定めた方法によって行われます。データを得てから恣意的な解釈を行わないためです。したがって、「有効性・安全性の評価」方法などの記述は「治験の計画」での記述と重なりますので、翻訳する際、これとの整合性を図る必要があります。
治験結果を恣意的に解釈しないために、どの患者をどの解析に採用したのかを明記します。例えば、治験薬投与全患者なのか、治験実施計画書で定められた観察(例:血圧値)が規定どおり行われた患者なのか、最小限の観察が行われた患者なのか、規定どおり服薬した患者のみか、などを明示します。治験実施計画書に定義がない場合はデータの採用・除外基準がいつ(開鍵(code breaking)=盲検のコードを開く前か後か)設けられたかを明らかにし、また解析除外全患者の全データを一覧表にし、その理由も分析します。
重要な人口統計学的特性(demographic characteristics)(年齢、性別、身長、体重、人種、民族など)及び基準値(baseline)、疾患因子、その他治療に対する反応に影響する因子について、群別のデータを示します。また治療の遵守状況(compliance)も記述します。
主な有効性評価の全測定値(主要エンドポイント及び副次的エンドポイント、薬力学的エンドポイント)について治療群間で比較し、治療間の差の大きさ(magnitude of difference)及び信頼区間(confidence interval, IC)を示します。仮説検定(confirmatory test)をしたなら、その結果も示します。共変量(covariance)による影響とその調整、脱落例や欠測値の取扱い、中間解析の根拠と統計学的調整、多施設共同治験(multi-center trial)、多重比較(multiple comparison)、部分集団解析(sub-group analysis)などについても記述します(用語の詳細はWebや成書の「統計用語辞典」、ガイドライン「臨床試験のための統計的原則」などを参照)。
個別反応データの一覧表、薬剤の用量・薬物濃度と反応との関係、薬物‐薬物(又は疾患)との相互作用なども図表として示します。
有効性の評価は、試験ごとに評価項目も基準も検証方法も異なり、全てに通用する内容は示しにくいので、実際に医薬関係の雑誌や、製薬会社のHPの治験関連のページ、FDAのデータベースなどで、総括報告書や概要を参照して下さい。
12)安全性の評価(safety evaluation)
薬の安全性や有害事象*(adverse event)については治験開始前に予測されるものもありますが、分からないことの方が多いのです。そこで、段階的にまず、投与量、期間、患者数を検討して問題を予測し、次に比較的よく見られる有害事象、臨床検査値(laboratory data)の変化などを把握して治療群間で比較し、さらに時間依存性(投与期間が長くなれば、有害事象が増えるのか)、人口統計学的特性との関係、用量または薬物濃度との関係など、副作用*(adverse drug reaction)または有害事象の頻度に影響する可能性のある因子について分析し、最後に重篤な有害事象**(serious adverse event)及び他の重要な(significant)有害事象を明確にします。
*有害事象(adverse event): ICHの定義で、治験中に被験者に生じたあらゆる有害な事象。治験薬との関連は 問わない。これに対して、副作用=有害反応(adverse drug reaction)は治験薬との関連が否定できないものをいう。 従来言われていた副作用(side effect)は薬の「主作用」に対する言葉で、これが望ましくない作 用であることが多かったが、薬との関係が厳密に検討されたものではない。治験ではICHの定義に従う。
**重篤な有害事象とは、「死に至るもの」「生命を脅かすもの」「治療のため入院、または入院期間の延長を要するもの」「永続的または顕著な障害・機能不全に陥るもの」「先天異常をきたすもの」を指します。その他の重要な有害事象には、著しい血液学的異常や他の臨床検査値異常、及び薬剤治療の中止や減量、重要な併用療法の追加を要するものが含まれます。
治験中に発現した全ての有害事象は叙述形式(narrative)で簡潔に記述し、より詳細な一覧表(患者ごと、重篤有害事象別、等)及び分析によって補足し、被験薬と対照薬いずれに関連する事象も表示します。
有害事象はすべて重篤度のカテゴリー別に定められた期限内に規制当局に報告し、また、未知のもの、重篤なものは「治験薬概要書」に加えられ、治験実施施設にも報告されます。臨床検査値異常についても一覧表にまとめて、検討しておきます。
有害事象報告や臨床試験の有害事象の用語はICHで統一されたICH国際医薬用語集(MedDRA)のものを使うことになっています。データベースは「医薬品医療機器レギュラトリーサイエンス財団」(http://www.pmrj.jp/jmo/php/indexj.php) が管理していますが、一般の利用料は年間30万円と高価です。しかし、有害事象翻訳には不可欠ですので、有害事象報告の翻訳を頻繁に扱う翻訳会社は、会員になっておくことをお勧めします。
では、例題を訳してみましょう。降圧薬の試験の有効性と安全性の評価基準です。
例題2 原文
Criteria for Evaluation
Primary variables
The primary variable was the change from baseline (Visit 5) in mean sitting diastolic blood pressure.
Secondary variables
The secondary variables were change from baseline in mean sitting systolic pressure, biomarkers, and brachial artery flow-mediated vasodilation.
Safety and tolerability
Safety assessments consisted of monitoring and recording all adverse events (AEs) and serious adverse events (SAEs), the regular monitoring of hematology, blood chemistry and urine values.
例題2 訳
評価基準
主要評価項目
主要評価項目は坐位平均拡張期血圧の基準値(来院5)からの変化とした。
副次的評価項目
副次的評価項目は平均坐位収縮期血圧の基準値からの変化、バイオマーカー、前腕動脈血流測定による血管拡張の程度とした。
安全性と忍容性の評価項目
安全性の評価は有害事象(AEs)と重篤な有害事象(SAEs)の観察と記録、定期的血液学検査、血液化学検査及び尿検査より成るものであった。
13) 考察と全般的結論(discussion and overall conclusion)
最後の考察では有効性と安全性の結果及びリスク・ベネフィットの分析を振り返り、これまで述べてきたことを引用して、簡潔に要約し、考察を行います。新しい、又は予想外の所見が得られたなら、明記してその意義を説明します。可能性のある全ての問題について論じ、既存のデータを考慮して、結果の臨床的適切性と重要性について述べ、今後の治験実施のための意義を明らかにします。
なお、本文中には含めない図表がありますので、ガイドラインの別添を参照して下さい。