FIMの科学的脆弱性とFIM利得の構造的危険性
- Nagashima Kazuhiro
- 3 日前
- 読了時間: 9分
はじめに、私はFIMという評価方法を否定するわけではありません。
現在の状況であれば、FIMは臨床上有用な共通言語で在り、介助量の変化を共有する補助指標として意味があります。
ただ、その科学性には限界があるということを言いたいのです。
1)FIM(機能的自立度評価法)とは何か?
言うまでも無く、FIMはADLの指標として使われている評価尺度です。
ADLの評価尺度としては、1965年頃より、バーサルインデックス(BI)が使われていました。BIは「日常生活動作の自立度」を簡便に測るための尺度です。
BIは、食事、移乗、整容、トイレ、入浴、歩行、階段、更衣、排便、排尿等を基本的なADLとしてセルフケア能力を評価する目的で作られたものです。
しかし、簡便であるがゆえに認知、コミュニケーション、社会的判断など実際の日常生活で自立を左右する要素を十分に含まず、また、点数が粗いために介助量の変化や軽微な改善を拾いにくいと云う問題を抱えていました。
そうした問題に対して、1983年頃、米国のリハビリテーション関連学会のによって開発されたのがFIMです。
したがって、FIMは、BIに含まれていなかった、認知/コミュニケーション/社会的判断などを含み、介助量も点数化するような尺度としてつくられたわけです。
日本に導入されたのは1990年頃のことです。
2)FIMの妥当性
1983年にFIMという新しい尺度をつくった際に、当然その尺度の妥当性は検証されました。
検証の中身は、
内的一貫性〜機能的自立度/介助量という概念にどの程度まとまっているかという検証
反応性〜入院時と退院時でFIM得点がきちんと変化するかと云う検証
構成概念妥当性〜FIMが計りたいものを測っているのであれば、こうした患者ではこういう点数になるはずだという仮説に基づく検証
因子構造・下位尺度の妥当性〜運動項目と認知項目に対して、因子分析などを用い、FIMの運動下位項目、認知下位項目が成立するか否かの検証
評定者間信頼性〜誰が評価しても同じような点になるかの検証
併存的妥当性〜評価尺度、特にBIとの相関から見る妥当性
と整理できると思います。
内的一貫性/反応性/構成概念妥当性/因子構造/評定者間信頼性などは、FIM自体が評価尺度として一貫した構造をもつか、臨床的変化を捉えられるか、また誰が評価しても一定の再現性を持つかを確認する検証と言えますね。
併存的妥当性というのが既存の尺度であるBIと相関関係を確認することで、BIと比較しても、妥当性があると考える物であろうと思います。
これでは、ADL尺度の妥当性を、ADL尺度の内側で確認しているに過ぎないと言えますね。
さらに、BIと相関が高いという事は、BIと同様にADL自立度を反映していることを示す事になりますが、新たに入った認知・コミュニケーション・社会的認知などについては別に検証される必要はあリます。
さて、すると、BIそのものの妥当性はどの様に評価されているのかが気になります。
BIの妥当性に疑問が出れば、それと相関しているFIMも妥当性に疑問が生じる事になりますので、知りたいですよね。
BIは1965年にMahoneyとBarthelが発表したADL評価尺度で、食事、移乗、整容、トイレ、入浴、歩行、階段、更衣、排便、排尿などの基本ADLを点数化するものです。現在も脳卒中や高齢者リハ、臨床研究で広く使われています。
BIの妥当性は、FIMのように「新しい尺度を大規模データで検証した」と言うより、臨床で使われながらADL障害を現す尺度として妥当かどうか、後から積み上げて確認されてきたという性格が強い物です。
ということは、ADLを、食事、移乗、整容、トイレ、入浴、歩行、階段、更衣、排便、排尿などに分類した基準という物は科学的に検証されていないわけです。
これでは科学より哲学に近いのです。
したがって、FIMも同様な事が言えますね。
3)FIMの科学性
かつて、哲学者のアリストテレスは、人の持つ感覚を視覚/聴覚/触覚/味覚/嗅覚の5つ、五感に分類しました。
哲学は、「何が正しいか」「なぜ存在するのか」といった本質や根拠を言葉と論理で探求する学問です。一方、科学は「どの様に起きているか」を観察や実験を通じて客観的に検証し、法則を明らかにする学問です。
アリストテレスの提唱した五感は、後に科学によって、それぞれの感覚の受容器やそれが情報処理システムである脳に運ばれる経路などが同定され、五感に含まれない他の感覚等の存在〜例えば前庭感覚や重力感覚、或いはそれらが統合された身体図式と言われる感覚や自己主体感覚など〜が明らかになりつつあります。
一方、FIMなどのADLの分類については、未だに哲学のままのように見えますね。
現在の脳科学では、ADLというのは、身体内環境情報と外環境情報などが脳の中に取り込まれ、脳の各領域と基底核とのループ上の情報処理構造の中で、環境の中で最も適応が期待できる行為情報、行動情報、運動情報が自動的に選択され、学習され、高度に自動化される形で出力される行為/行動/運動の形である事が理解されつつあるにもかかわらず、未だに哲学的な分類のままに尺度として利用されていると言えます。
これは、科学的に脆弱であると言えるのでは無いかと思うのです。
あ、個人的な見解ですよ。
(^_^;
蛇足ですが、脆弱であるからだめだというわけでは有りません。科学というのは徐々に完成度を高めていくプロセスが重要な学問体系ですので、現在ある科学というのは常に未熟であるか脆弱であるというのは、ある意味当然であって、それを知った上で運用することが大切なのです。
4)FIM利得の構造的危険性
FIM利得というのは、「入院時FIMと退院時FIMの差」です。
回復期リハ病棟は、2000 年度診療報酬改定で創設されました。
最初は、対象疾患、発症、術後から入棟までの期間、医師配置、リハ単位数など、主に体制やプロセスを評価で成り立っていました。
2006年度に、リハビリテーションが1日6単位から9単位まで算定可能となり、より集中的なリハ提供が制度的に認められはじめます。
そこで、支払側としては当然「たくさんリハを提供している病棟は、本当に患者をよくしているのか?」という疑問が生じます。
そして、2016年度診療報酬改定で、回復期リハ病棟に対してアウトカム評価〜実績指数が導入されることになります。
実績指数というのは、
FIM利得(退院時FIM運動項目ー入院時FIM運動項目)÷在棟日数の補正値
という数式で求めます。
ここでFIMが制度に取り込まれ、リハビリテーションの質の指標として使われることになったわけです。
2016年度改訂では、一定のリハビリ提供実績がありながら実績指数が2回連続して27未満の場合、6単位を超える疾患別離ハビリテーション量が入院料に包括されることになっています。
つまり、6単位以上は出来高で算定できなくなる仕組みですね。
もともと科学的に不完全なFIMという日常生活に関わる指標をリハビリテーションの質の評価や、保険制度の指標として用いたわけです。
それは最初から様々な問題を引き起こすことが予測されたはずです。
ひとつは、リハビリテーションの目的がFIMの改善に取って代わることですね。
本来ADLの行為や動作は、自動化されていて無理が少ない物です。
その行為や動作をまとめ上げ、駆動するのは、恐らく腹側線条体と辺縁系周辺領域の情報処理が重要になる物と思います。
例えば、言語化するのであれば「お腹がすいたという情報から、美味しい寿司が想起され、食べたいといったような情動が生じた際に、それに関連する諸動作の情報処理がおこなわれ、例えば外出に適した服を選択し、更衣をおこない、車の鍵や財布や免許証を探し、カバンに入れて玄関に出て靴を履き、車に乗り込みながら寿司屋までの道順を想起し、車のエンジンをかける〜以下略」といった系列動作が自動的に生成されて行動に変換されていくプロセスそのものが成立するのがリハビリテーションの目標であるべきなのだろうと思うのですが、それが極度に単純化されたFIMの項目の改善に取って代わってしまうわけです。
制度に取り込まれれば仕方が無いことと言えますね。
さらに制度上、FIMの測り方にも問題が生じるだろう事も解っていたはずです。
全国リハビリテーション医療関連団体協議会は、2022年度診療報酬改定に向けた要望書を厚生労働省に提出しています。
回復期リハビリ病棟関連で、「第三者評価によるプロセス評価の導入」を求めています。
これは、リハビリテーション実績指数が年々上昇していることの要因として、在院日数の減少と共に入棟時のFIMの低下が上げられ、「入院時に意図的にFIMを低く評価しているのではないか」という指摘があり、リハビリの質の向上を目的とするアウトカム評価は、適切な運営プロセスに裏打ちされる必要があるとし、日本医療機能評価機構がおこなう病院機能評価などの第三者評価の認定を要件として要望したのです。
これはある意味、病院の自衛的な側面があるのだろうと思うのです。先に述べたようにFIMの検査項目は哲学的な側面を含んでいますので必ずしも科学性が高い物ではありません。科学性とは仮説と実験による検証のプロセスですので再現性が重要になりますが、実はある意味再現性に乏しさを内在しているのが哲学の側面でもあります。つまり、FIMの再現性は検査者の善意によって維持されているところがあるのです。
病院でおこなわれるリハビリテーションの目標をFIMに落とし込まれ、それをリハビリテーションの質だと言われ、それに従わざるを得ない状況で、さらに病院収入を抑えられては、入院時のFIM得点を下げるというような対応が出てきても構造的には仕方が無いことのように見えます。
つまり、FIM利得を制度目標にしたから、こうしたダウンコーディングの誘因が生じたのです。
これは、単なる不正の問題ではなく、FIMという科学的に不完全なADL指標を報酬/ランク付けに使うことによって生じた構造的副作用です。
本来構造の設計者に問題があるのですが、「第三者評価で自浄作用を」という言葉を使うことで、責任は病院側にあるとすることに私は非常に強い違和感を感じます。
5)本当の問題
これらのことは、言語化していなくても現場のリハビリテーションスタッフの多くがわかっていること、或いは感じていることなのだろうと思います。
「何だかおかしい」という感覚ですね。
(^_^;
当然、これらの制度設計をした医師などは私たちより数段頭が良いはずなのです。
つまり、初めからこんなことはわかっていたのだろうと思うのですね。
まず間違いなく。
では、なぜこうした制度を導入したのか。
たぶん、そこに最も大きな問題があるのです。
ここから先の思考は、かなり危険な物になりそうなので、取りあえず、思考はここで止めることにします。
(^_^;




コメント