SASユーザー総会論文集 1983年

>100 Views

April 20, 25

スライド概要

統計解析システムの調査とSASの導入・普及 石井俊夫
統計プログラム・パツケージの現況 大橋靖雄
PROC AIDの開発 木村豊
各種判別手法を用いた医療データ解析の標準化 新村秀一
SASの医療分野への応用の試み 青木浩二
SASの実行効率化の試み 佐野雅之
SASを使ったIMSオンライン資料作成システム 宮武徹夫
書誌情報データなどの文字列処理へのSASの一利用例 上島壮
カテゴリカルテータを扱う関係型テープル上の操作とSASによる実現例 田町典子
統計データベース実験システム 佐枝三郎
CCUシステムにおけるSASの活用 三嶋博昭
S/KANJIの開発 佐枝三郎

profile-image

SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

'83SUGI-~ 日本SASユーザー会論文 . . 日本SASユーザー会

2.

日本 SA Sユ ー ザ ー 会 世 話 人 会 代表世話人 野 村 副代袈世話人 戸 口3 昌 妻E 法 く f 7 陽 武 z E 三 忌 , コ 金 斡 十 き 斡 幹 ・ a ・ ah 斡 革7 本 k タシステム糊) (附和コンビニヱ (い Y 指 総) 介 (鞠 敬 (1 L 勝 久 (日本ソフトウ 正 人 (全日本 輸繍) 良 色 { 〈日本議券 用銀 下 v フ 列f 大 アヱンジニアリング善お〉

3.

目 統 計 解 析 シ ス テ ム の 議 査 と SASの 導 入 ・ 普 及 次 ・………株式会社背中主務自……石井 俊夫 八氷 川i 畑茂男 統計プログラム・パッケージの現況・・・・・・…………………東京大学工学部…………大橋 靖雄 ? PROC AIDの 開 発 … … … … … … … … … … … … … … … 三 井 情 報 鰐 発 株 式 会 社 … 木 村 農 19 蔀 ・ ah 社 新村 発ョー 25 大阪府立成人病センタ 鈴木接…部 山 . . 各種半J I} . lJ I手法を用いた医療データ解析の標準化……………注簡コンピユータサービス株 修 司 t : fl萌 克 i 3 SASの 涯 療 分 野 へ の 応 用 の 試 み … … … … … … … … … … … 大 阪 府 立 母 子 保 縫 総 合 喪 療 セ ン タ 35 i 1原 f 告 コゴ鶏 湾関 潟村 徹郎 SASの 実 行 効 率 化 の 試 み … … … … … … … … … … … … … … ) 字 情 報 開 発 株 主 発 雅之 佐 SASを 使 っ た lMSオ ン ラ イ ン 資 料 作 成 シ ス テ ム … ・ 命保険棺 所 41 システム鷲理課 徹夫 47 … F 島 壮 51 ・綬済企閉庁………………盟問 典子 65 誌 情 報 デ ー タ な ど の 文 字 列 処 理 へ の SASの 一 利 用 例 ・北海道大学王 υ カテゴリカルデータを扱う関係型テーフコレ上の操作と SASに よ る 実 現 例 . 佐藤英人 統計データベース実鞍システム………………………………三井 開発株 研究所 校正郎 77

4.

¥ ccuシステムにおける SASの 活 用 … … … … … 一 … … … 大 観 府 立 成 人 病 セ ン タ ー 三鵠博開 87 青木 荷村徹郎 若 杉 茂 幸] 1 野村 裕 コンピユータサーピス株式会社 松村純一 松尾正夫 S/KAN]Iの 開 発 … … … … … … … … … … … … … … … … 円 三 井 欝 報 開 発 糊 … … … … 佐 校 日議エレクトロニクス鞠 中村 三部 95 ‑ ・ a

5.

統計解析システムの諜 と SASの 導 入 ・ 普 及 当社では*阪に されている大型コンビュータを中心に、全毘各地の本 ぞ行なっている。 技術研究所会オンラインで結び、各種の電算処開 昭和 5 1年の T QC導 入 以 来 、 社 内 に お い て 、および、 データ解析の重要性が一段と され、 ζ の方面のコンピユータ活用も活発に行なわれるようになってきた。乙れらの業務に遊間する 8年米国カリフオノレニア大学から導入した統計パッケージ BM ソフトウエアとして、昭和 4 DP ( B i o m e d i c a lComput日r Programs‑P)、および当社数惑で鵠発した目的関プログラムがあ る 。 a・ BMDPに つ い て は 、 年 々 機 能 拡 張 が 行 な わ れ 使 い や す く な っ て い る が 、 価 絡 体 系 等 の ら 当 社 で は そ の 拡 張 を し な か っ た た め 、 活 現 の 活 発 化 か ら く る ニ ー ズ の 多 様 化ζ i対 応 できなくなってきた。 当社では乙れらの実構をふまえ、昭和 5 6年 4月 よ り 新 し く 統 許 解 析 、 ビ ジ ネ ス ・ グ ラ フ イ ツグス・システムの議資・検討を行なってきた。そして、昭和 5 7年 4月 に は 新 し い シ ス テ ム として統計解析システム SAS C S t a t i s t i c a lA n a l y s i sS y s t 告m ) を導入し、全社長くJle普 友 を 進 めてきたので、以下にこれらの詳絡について述べる。 2 . 統計解析関係プログラムの科窮状況 新しい統計解析システムの議査に入った昭和総年までの、統計解析関係プログラムの利用 状 況 は 、 関 ‑ 1l e; 7 ,すとおりであ 2 5 0 る 。 ・ ah 昭和 5 4年から統計解析揺でのコ に伸びてき 科 用 状 6年 の 実 畿 に つ い て 昭 和 た。昭和 5 i 兄 ンピユータ活用 5 4年度と比較してみると、 JOB 件数で 2 . 4話、適用業務件数で1.7 指 数 となっている。 5 0ト 料用分野としては、建築 I0 01 . . . . . 1 . Itl 報の各穂分析、実験計総データの 分析、アンケートの分析、各種 手2 53 54 5 5 函 一 1統許解析際係プログラムの利用状況 (昭和 54年 =100) 理データの分析等、技術分野、 務分野を関わず多種多様である。 AH ‑!!ンター開発部長、 56持 食会問開発部導門課長 交交交問開発部 ムH 食品 H 交交交 夫章男 控茂 弁木嬬 五八 M m 務 脂 脅 工 中 梯 1 . はじめに

6.

また、活用手法が多様化、高度化しており現状のシステムでは、満足のいく対応、が困難とな ってきている。 表‑1統計解析システム 要 一次 機 機 求 当社の現状 ‑ 次 聞と当社の現状 のカテゴリー化 ム 新変数の生成(変数変換) ム X タの立をベかえ × × × データの合併、分離 ム × × 入力ファイルの多様性 ム ム ム 入力データ!毒性の多様化 ム ム ム 分析結果のファイル出力 × × × 大量データへの対処 ム ム ム 欠損データの取扱い ム ム ム データ選択の多様北 ム ム ム 変数のウェイトづけ ム X × 毎 .作 図 .{乍表 グラフ作)j主 ム × ム 作 表 作 ム ム X ム ム ム 。 。 ア データの変換・編集 ドの併合 す タ 工 実行時のデータ選択 表 多 。 。 時系持分析 ム f ヒ 療 × 本統計 続 ~t 続 計 法 手 数 法 計 算 手 誇 用 .{東剤 ‑解説書 解 欝 維翁 維持 . 。 限 定 受 { !持湾 × デ…タのファイル主&1 日 力 管理 強い システムA システムB システム C l o 次 。一 コ 全体評価 喜 善 い ム × 使い ム 手法説明 ム 出力結果の見方 ム 。 。 事例集 × × プログラムミスのリカバー X b 岬町 下 ム × ム ム 機能改良への取り組みみ . . × 3 . 統計解析システムに求められる機能とさき社の務状 企 業 に お け る 続 討 解 析 ニ ー ズ に 対 応 す る た め に 、 ま ず 、 表 … 1,と示されるような、要求機 能の展開を行ない、それをもとに当社システムの現状を洗い出した。 2

7.

求められる要件は、大きくは以下の 5 まとめられる。 1) デ ー タ 加 工 の 容 易 性 2) グ ラ フ 、 表 作 成 の 容 易 性 3)統計手法の充実 4) f 費用説明書、解説書などの繋備 5) ソ フ ト ウ ェ ア の 維 持 管 理 の 充 実 特に 1) の デ … タ 加 工 に つ い て は 、 以 下 の 理 由 か ら 議 繋 で あ り 、 我 々 の 経 験 か ら 当 社 に お い ては、統計解析システムの優劣を決定づける大きな要閣であると考えられる。 1)慕本銃計から多変麓解析まで、あらゆる分析で使関される機能である。 . . 2)経営情報システム等、日J Iア プ リ ケ ー シ ョ ン と の イ ン タ … フ ェ ー ス を と る 時 に 必 要 な 機 能であるの 3) 分 析 結 果 を さ ら に 分 析 す る な ど 、 一 貫 処 理 で き る と と 乙れらの要求機能について~社が保手干している統計解析関係プログラム後評価した結果、 特に 1)のデータ加工の部分に議点がある乙とが分った。 4 . 新統計解析システム色弱査と と fデータ加工 j 機 能 を r t心として 我々は、新しく導入する統計解析システムとして、特 l の機能について謁査を汗なった。 まず第 1段 階 と し て 、 約 60種 簡 の シ ス テ ム の 概 略 に つ い て 調 査 し た 。 我 々 が 求 め て い る シ ステムは、グラブのみとか、クラスター分析のみという個別解析向けのものではなく、あま り専門的〈できれば専門的な方がよいが〉でなくても、広範館をカバーするいわゆる汎用統 計解析システムであり、 . ζ れ を 条 件 に 検 討 し た 結 果 、 第 2段 騒 の 謁 査 対 象 シ ス テ ム は ほ 穣 態 となった。 6年 1 0月 に は 、 福 岡 で 行 な わ れ た 一方、幸いにして、昭和 5 r I n t e r n a t i o n a l Symposiumo nCo と参加する機会が得られ、フランシス教授(コーネル大学〉の m p u t a t i o n a lS t a t i s t i c sJ I 解析システムの捕ま妥結祭〈システム提供者側とユ…ザ鰐の評締結果)を宿く乙とができ、大 いに参考となった。爵… 2,ま講演集より評価結果を抜粋したものである。 点、を考え、 E 喜一 2から分るように、特にデータマネ 以上の結果、さき投のデータ加工機能の顎 J ジメント機能が高く評価おれている SASを導入検討システムとした。そして、園内 SAS ユーザーの詰向調査も行ない、限和 5 7年 1月 よ り 、 デ ー タ マ ネ ー ジ メ ン ト 機 能 を 中 心 と し て SASのテストユースを行なった。 3

8.

S S 入 システム A システム日 ユーザインタフエース 言 十 イル バッチ ‑TSS処理 自然言語の近さ 一苔笠間のレベル 計算機教育 ン ス O機 能 な し ・ ' ト ¥11!jjJ ザカザ 価飯錨 詳評評 ユメユ ' e 重量 ↑ 統計システム比較 統計教育 E 喜 2 OR 3機能あり 数学関数 一時系列分析 一計量経済分析 一マルチウェイ分析 一ノンパラメト九グヂ統計 一非線型回帰 一分散分析 一多変量解析 項 一重回帰分析 作一表の計算 価 表⁝表の出い川 Illi‑‑ii 一ネンアトト タジ十一山複雑なストラク安ャ デマメ一ファイルマネジメント 評 統 計 パ ッ ケ jジ 自 統 5 . S A Sの 全 社 的 な 普 致 活 動 スにおいて、詳縮機能 テストニエ S A Sは当社の の評価をした諮 ズζ i 。 9 ∞ 致 し て い る ζ とが分り、 用 4J 3 入を なった 件 間 事 1 ' ‑ 当社 i とおける S A S導 入 合 目 的 は 「コンピ品…タの料用経験があまり ないエンドユ ザ 、 数 でも、 S A Sを (指数﹀ 使ってレポート作成、 グラフ作成、 統計解析 7 う t 務と密 ようになる。 第 1悶 J ζ とであり、 として、 以 社的な しでできる 及活動を の 5 * ζ れを そ中心 i と ~-3 5 6 51開 統計解析システムの利用状況 ( 5 4年 = : 1 00 ) なった。 S A Sとはどのようなものか。 2) S A SでいIができるのか。 3) SAS~ 使う ζ とによって、事'1 ‑4

9.

用者にどのようなメリットがあるのか。 S A S O説 明 会 に は 、 当 社 の 教 育 マ ニ ュ ア jレそ作成し J 下記 l と示す議長装等で計 2 6回実施し、 と及んだ。その結果、昭和 5 7年 度 の 統 計 関 係 シ ス テ ム の 利 用 状 況 は 、 圏 総受講者数は 650名 l , 一 3 ζ 示すように急激に伶びた。 1) SA Sの 使 用 開 訟 に 伴 う 全 自 説 明 2) 管 理 者 構 報 シ ス テ ム 3) 情 報 セ ン タ ー 研 修 生 情 報 シ ス テ ム 教 育 4)新入社員コンビュータ 6 . 蔑された課題 S A Sの 控 用 開 給 に よ っ て 、 エ ン ド ユ ー ザ ー の 統 計 解 析 揺 に お け る コ ン ビ ュ ー タ の 活 問 度 が急速に高まったが、 では次の点、が課題として残された。 1)各本支1;51 とS A S利 簡 の 核 に な る 人 が ま だ 育 っ て い な い た め 、 シ ス テ ム 部 門 が ほ と ん ど科間相談 i と応じており、利用効率が廷い。 a 2) SASの 高 度 な 統 計 解 析 手 法 ( 多 変 量 解 折 、 尺 度 解 析 な ど ) に つ い て 、 シ ス テ ム 部 門 がまだ十分に使い乙なしていない。 3)教育問に作成した当社マニュアルに連解しづらい崩がある。 上記問 の 1)については、 各本文広 iζSASの中核翁ぞ予ぎてるべく、さらにレベ Jレの高い S A S教 育 を 計 画 し て い る ο 2)については、我々で勉強会を鵠催し研究すると共に 大学とコンタクトそとって進めていく である。 3)については、 S A Sの 市 販 本 が 出 版 されると艶いており、それを参考に再検討する である。 7 . SASに対する嬰望 約 1年間 S A Sを使潟した結果、当社では解決闘難な爵題点、が生じたので、 ζ れぞ S A S に対する要望として記する。 ・ ah 1) 解 析 手 法 裁 び 結 5 誌の見方に嬰するドキュメントが参考文献としてしかないため、解析 結果の解釈が悶難である。 (解析手法ζ i関 す る ド キ ュ メ ン ト の 整 織 を し て ほ し い 。 ) 2) S A S IGRAP況において漢字出力ができない。 〈漢字出力ができるようにしてほしい。) 3) SA S本体でブロック・チャート作成時に、カテこi、1 ) 敷のきびしい制F 授を受ける (マルチ・ベージ出力でもよいから、乙の告J I限 を も っ と 緩 和 し て ほ し い 。 ) 8 . おわり ζ i 以 k統 計 解 析 シ ス テ ム の 謁 査 か ら S A Sの 普 及 に 至 る ま で の 及び¥そ乙で発生した 題点そr:t心に述べた。全体として S Aら は 、 統 計 解 析 の み に と ど ま ら ず その他のデータ加 工の極でもやj問できる、活用範閣の広いシステムである、というのが我々の実感である。 当社では、昭和 5 9年 完 或 を 目 ざ し て f : @ :社情報システム j を 機 築 中 で あ る が 、 乙 の シ ス テ ムによって議穣正きれる靖報の非定型解析に S A Sを 積 極 的 に 活 用 す る と 共 に 、 一 方 で は 、 社 内の fSA S利務者連絡会」を崩穫して、 S A Sの普友と有効活用を後滋してし、く予定である。 5

10.

統計プログラム・パッケージの現況 ‑‑‑SAS と B M D Pを 中 心 と し て 東大工学部計数工学科 大犠鰻雄 の、とくに欧米における統計プログラム・パッケージ(以後略して統計パッケ…ジ)の "には日ぎましいものがある。統計パッケージと言っても、データの審理・編集から な統 の適用とその結果む解釈にまで至るデータ解析の流れのどの部分を受けもつパツケ ジか、あるいはどの部分信機能が豊富なノ f ッケージなのかによって幾つかの分類各行なう ζ とが可能であるが、本裁では、家者が最も関心を持っている解析に京畿を麗いた統計パツケ ジぞ .. な お 、 現 薮 公 け に さ れ て い る 統 計 パ ッ ケ ー ジ の う ち 117パ ッ ケ ー ジ に 関 す る 調 査 の 結 巣 が BL ranci s i ijに発表されている。(日本語による簡単な紹介が浅野・田中山にある。 )ζ のヌドのゆ 1種ζ i分 類 し 、 各 パ ッ ケ ー ジ に つ い て 開 発 者 お よ び で 、 Francisは統計ノぐツケージを大まかに 1 ニ L …‑lf'ーの評舗をアンケート調査から集計し、そむまとめを行なっている。 さで、解析に全線を置いた統計パッケージにおいては、 発展"は大きくいってこつの向に 分けられるだ、ろう。 つは 多様化"あるいは 分化"む方向である。一般化された線型モデルの解析受持なう G‑ LIM(G 母n e r a l i z e dL i n e a rI n t e r a c t i v e羽 o d e l l i n g )、 分 布 の 当 て は め や 曲 線 当 て は め 後 最 尤 法 で なう MLP(MaximumL i k e l i h o o dProgram)、多重分筈J I表む解析を行なう日 C TA(日開ryma出 C o n t i… 略的む yT a b l eA n a l y s i s )など、特定の型のそデル、特定の裂のデータそ対象とした統許パツケ…ジ が数多く開発されている。乙の種のパッケージは、最新の階論あるいはかなり a・ な理識をプ ログラムしたものも多く、相当な専門知識を持たないと使い ζ なすのは難しいように患われる。 もう一つの方向は 巨大化"への途である。 SPSS( S t a t i s t i c a lPacka 伊 f o rt h恐 S o c i a lS c i告n c e s )、 BMDP( B i o m e d i c a lComputerProgram一町、 SAS( S t a t i s t i c a lA n a l y s i sS y s t e m )など世界中の多く の研究者が利用している 汎用"統計パッケージは、後述するような点、でますます機能安多様化 し、巨大なシステムとなりつつある。そして ζ れが、良くも懇くも 汎期 パッケージに関 す る 様 々 な 問 題 を 引 き 起 ζ している乙とは疑いない。 汎用統計パッケージの 巨大化" とくにSASとBMDPをゆ心にして、汎用統計パッケージの琵大化について述べてみたい。 の Fran c i sは、汎湾統計パッケージとして、 CS,SAS,0訪 問 TAB,HPSTATPACKS,MINI‑ TAB,BMDP,NISAN (未だ完成していなし、)、 GENSTAT,SPEAKEASY,TROLL,IDAの 1 1穂を挙 ( 1 )F r a n c i s,I .(1981 ) ,S t a t i s t i c a lS o f t w a r e ( 2 )浅野長一部・由中 AComparativeR e v i e w .North…Hol Ia n d . 潔 (1982)、統計・プログラム・パッケージと多変畿解析、数理科学、 Nu230、 p p . 67‑75. ‑7‑

11.

げている。 ( SPSSは P‑STATな ど と 共 に 、 解 析 機 能 は 若 干 あ る が 、 む し ろ フ ァ イ ル 処 理 ・ 編 集 ・作表機能が強力なノ f ツ ケ ー ジ に 分 類 さ れ て い る 。 ) 乙 の う ち 筆 者 が と く に な じ ん で い る の は SASとBMDP (それに強いて挙げるなら SPSSと MINITAB) の み で あ り 、 他 の パ ッ ケ ー ジζ l対す る知識はマニュアルやノ f ン フ レ ツ ト を 読 ん だ 程 度 の も の で あ る 乙 と が 、 乙 の 二 つ を 取 り あ げ る 第一の理由であるが、その他にも若干の理由が存在する。 まず、上記の 1 1種のノ f ツケージのうち最も多くの、(研究)施設で用いられているのが SASと BMDPである。 BMDPは 1 ,500以上、 SASは 3 , 000 以 上 の 施 設 で 用 い ら れ て い る 。 ( た だ し、英国では GENSTAT が広く用いられている。)また、 BMDP は パ ッ チ 使 用 を 前 提 と しており、データ入力から計算結果の出力まで解析の一通りを行なう独立したプログラムの 集合体であるのに対し、 SASは 会 話 型 使 用 に も 適 し た コ マ ン ド 言 語 の 体 裁 を と っ て い る 。 ま た 、 BMDPが解析の流れの 標準"を与えようと指向している(ように思われる)のに対し、 SASは ζ ) 提供し、その選択と使用法 ( s t r a t e g y )はユーザーまかせの 極めて多様な手法を(一見無造作 l . . ̲ 部 分 が 多 い と い う 点 で も 、 両 者 は 対 照 的 で あ る 。 乙 の よ う な 理 由 か ら 、 SASとBMDPを 取 り あ げれば、現在の汎用統計パッケージの状況と問題点、は一通り把握できると思われるのである。 なお、 BMDPの各プログラムは、 P4F"の よ う に 頭 文 字 P . 1ケタの数字、 1文 字 の ア ル フ ア ベ ッ ト を 組 み 合 わ せ て 表 わ さ れ る 。 最 後 の ア ル フ ア ベ ッ ト は 表 示 1l e示 す よ う な 大 雑 把 な 分 類 9 7 5年には 2 6,1 9 7 9年には 3 6であったが、 1 9 8 1年 に は 43ζ I を示している。プログラムの数は 1 増 え て い る 。 マ ニ ュ ア ル は ほ ぼ D, F,R,V,M,L,Tの順ζ l手法ごとにまとめられており、指定ノ f ラメータを掲載例のように設定すれば、一通りの解析を行なう乙とができる。 それに対し、 SASによるジョフは. (SASユ ー ザ ー に は 言 う ま で も な い 乙 と だ が ) 表 示 2I ζ示 すように、 DATAステップと適当なプロセジャーを選んで行なう PROCス テ ッ プ と 組 合 わ せ て 一 通りの解析を行なうようになっている。 表示 1 プ U セジャーとしては、後ζ l例 を 示 す よ う ζ l極 め て 多 様 な 解 析 手 法 が 取 り 入 れ ら れ BMDPの プ ロ グ ラ ム の 分 類 D 記述統計 F 頻度データ(多重分割表)解析 もSASユーザーなら熟知の乙とであろう。 R 回帰分析 マ ニ ュ ア ル は 、 ア ル フ ア ベ ッ ト 1闘にプ V 分散分析 ロセジャーが並べられた形式をとってお M 多変量解析 り、適切なプロセジャーを選ぶためには L 寿命データ(生命表)解析 l一 通 り 目 を 通 し 、 個 々 の プ マ ニ ュ ア ルζ T 時系列解析 ロセジャーの特長と限界をある程度心得 S その他 l増 え て い る 乙 と ており、その数が改版毎ζ ておく必要がある。 一 例 と し て 、 表 示 3に 回 帰 分 析 の た め の プ ロ グ ラ ム (BMDP)と プ ロ セ ジ ャ ー ( S A S )を ま と め てみた。ただし、時系列解析、寿命データ解析、プロビット解析やロジッ卜解析、分散分析 ‑8‑ '

12.

(専用)のプ口グラムとプロセ 表示 2 ジ ャ ー は 除 い で あ る 。 表 示 4は SASに よ る ジ ョ ブ BMDPの プ ロ グ ラ ム と 同 等 の 解 析を 8A8で 行 な う 場 合 に 必 要 と されるプロセジャーの籾合わせ マージ更新 i 入 である。 力 さて、汎用統計パッケージの D A T Aス テ ッ プ プログラムによる 変換、検索、新変数追加 イヒの伊jと し て は 、 次 の 諸 点 げられる。 争ファイ Jレ処親機能、的シス SASデータセット テムとのインターブ品ース機能 鋪側肱 外部ファイル 出力(ラインプリ ンター、カ ド 〉 など多様な機能の導入 A l li non君"システムを指向し、 PROC ステッフむ 08ユーテイリティカ為らコンピユ 結菜の出力 {ラインブロリンタ一、グラ フ ぞyク・ディスプレイ〉 f l管 理 機 能 ま で も 有 す る タ還 f 8A8iま}JJ I格 と し て も 、 フ ァ イ ル 処 理 機 能 は 譲 銭 で あ っ た B羽 DP 1 までもソーティングの機能を持 つようになった。また、他パッケージとのインターフエス機能を持つ汎用統討パッケージも増 えてきた 0 o新 し い の とくに時系列解折、寿命データ解析、離散データ(とくに多重分害J I表 ) 解 析 、 提 索 的 デ ー タ 解 綱除 析 (EDA) I と 関 す る 手 漆 め 導 入 が 自 ざ ま し い o BMDPの 1 9 8 1年 版 で 新 た に 取 り 入 れ ら れ た プ ロ グ ラ ム と そ れ に 対 応 す る SASの ブ ロ セ ジ ャ ー を 中 心 に し て 、 若 干 詳 し く 説 明 し よ う 。 : 以 前 の BMDPには善寺系予言解析のプログラムは存在しなかったが、 1 9 8 1年 版 で 1TとBo 五一J 船 k i n s流 の ARI出 A モ デ ル 解 析 を 会 話 的ζ i行なう P2Tが はスペクトル解析のためのP I雲寺系予言解析のためのプロセジャーが 6種まとめられている。 加 会 れ た o SA8では SAS/ETSζ 主 主 A モデル解析む{也に、季節変動調整を行なうセン そ の 中 に は 、 ス ペ ク ト 1レ解析や上記の ARI サス (Xll)、 ζ i自 己 栴 療 が あ る 場 合 の 居 場 分 析 を 行 な う プ ロ セ ジ ャ ー も あ る 。 現 在 で は B ox‑ J e n k i n s流 の ア プ ロ ー チ 仰 が 持 系 列 解 析 の 主 掩 と な っ て き て い る が 、 乙 の 方 法 は 解 析 者 の主観的判断に依る部分も多く、 (少くとも我患では)応用例や実務的経験の蓄積はまだ不充 分なように思われる。 ( 3l B o x, G .お. P .&J e n k i n s,G.M.( 19 7 6 ),Tim告 8 e r i e s d i t i o n,Holden‑Day. 告 9 andC o n t r o I .r e v i s e d

13.

回帰分析のためのプログラムとプロセジャ 表示 3 SAS BMDP p l R : 説明変数を指定した重密漏 REG: 説 明 変 数 を 指 恕 し た 盤 問 帰 〈複数従属変数も可) 留婦診断、図録係数に闘する検定 S T E P W I S E : 変数選択 (i義次選択) RSQUARE: 変 数 選 択 ( 総 当 た り ) P 2 R : 変数選択〈遂次選択〉 P 9 R : 変数選択(総当たり) P 6 R : 偏相関と複数従震変数への 同時回帰 [ 釧 P4R: 主成分回帰 P5R: 直 吏 多 項 式 思 婦 〈 持 均 悶 一 一 最 酌 町 一 ) け 哨 分 淵 倒 一 散 肘 分 │ 共分散分析 説明変数を指定した 3 繋教凶帰、 i 回帰係数 i と関する検定、その他i P3R: 非 線 盟 国 縁 S Y S R E G : 同 時 方 競 式 モ デ Jレの解析/ PAR: 非線型図録〈微分を必要と RSREG: 反 応 曲 面 (2次 ) 問 帰 RIDGEREG: リツジ問帰 L A V : ロバスト回帰の しない) ,鴫除 N L I N : 非線型回帰、ロバスト由帰 表示 4 SASの プ ロ セ ジ ャ ー の 機 能 と 組 合 わ せ REGSTEPWISERSQUARE GLM SYSREG RSR おG R EDE 淑 EG LAV N LIN データ入力 変数変換 DATAス テ ヅ プ 1変数毎の 野被計量。 SUMMARY. 額損行手J I CORRな ど 測値と。 接差の計算 出 カo × × × × UNIVRIAT忍 o SCORE PRINT PRINT o PRINT P E ミ INT PRINT 0 強差プロット 4一一一一一 PLOT.GPLOT 正規プロットは RANK+(PLOT.GPLOT) BMDPのプログラムと S A Sのプロセジャーの対応 PIR P2R P9R P6R ,P 4R P5R P3R PAR タ に 一 入 力 . R E G ' " STEPWISE+REG" ' RSQ むARE 十R E G ' " 十 REG* P R I NC O K 4 3 3 + R B G * MATRIX 十R EG* }N L I N 要 約 統 ア 言 十 千 量 霞 桔 童 霊 IT 問 出 力 な ど 。 SCORE o / " " " REGを用いれば省略可 REG‑REGor GLMor SYSREG 喝 容 1 0 川崎

14.

データ解析 :Cox流 の 回 帰 分 析 、 す な わ ち 時 間 打 切 り が あ る 場 合 の 寿 命 を 目 的 変 数 と し て、務々要因の車三響を寿命分布の聖ζ i鑓する薮定なしに解析する回帰分析のプログラムが、 P2Lとして BMDPP:追加された。この手法は 1972年の D.R.Coxの 論 文 州 以 来 多 く の 数 理 統 の注目安引き、最近藤んに研究されている方法であるが、理論的興味が先走りした感が無き にしもあらず、である。 この手法は、臨床試験など底・薬学方面ではかなり応用されるようになってきたが、適用に よって成巣が期待される信頼性の分野、とくにフィールドデータを用いた製品寿命解析の分野 ではまだ殆ど応用されていなし¥0 ( 1 9 8 1年に Cox教 授 が 来 日 講 演 さ れ た と き 、 適 用 場 面 の 第 として工業製品の寿命解析を挙げられたのは印象的であった。〉また、通常の回帰分析に比べ ると、 ζ の解析法(データとモデル)においては モデルの妥当性の検証"が一層厄介であり、 ζ のための手法に穏する研究、およびその成果のプログラム化が望まれる。 d削除 SASIとは、増補肢に Cox流 回 帰 分 析 の た め の 二 つ の ( 若 干 機 能 が 異 な る ) プ ロ セ ジ ャ ー が 絞 め られている。 970年 読 後 か ら 轄 力 :離散データ解析は、前述の寿命データ解析と並んで、 1 的に務究されてきた分野山である。乙こでは、幾つかの項目によって対象が分類された 多 く多義クロス)表"の解析についてのみ述べるが、乙の型のデータに対し対数線望モデルを当 てはめて項話路の独立性・相互依存性を調べ、背後の構造を探索していくのが最近では主流の 解析訟となっている。 数 線 型 モ デ ル を 中 心 と し た 離 散 デ ー タ 解 析 の た め に は 、 前 掲 の ECTAを初め幾つかのパッケ 9 8 1年脹の BMDPIとは P4Fと い う 強 力 な プ ロ グ ラ ム が ジが開発され、また領発されつつあるが、 1 収められたっマニュアルでは、 . すにはかなりの知識が ζ のプログラムの説明に 6 3ペ ー ジ も が 費 さ れ て お り 、 使 い こ な であろう。なお、 GLIM,GENSTATな ど の 統 計 パ ッ ケ ー ジ で も 対 数 線 モデル令用いて解析を行なう ζ とが可能であるカミ高次元のデータ ζ l 対しては BMDPの P4F が も使い易いという がある。 SASでは FUNCATというプロセジャーを用いる ζ とができるが、 P4Fほど強力ではない。 〈おわ A) : J.W.すu k e y(ぷらの提唱する探索 t r Jデ ー タ 解 析 の 手 法 も 、 最 近 の 統 パッケージの多くが絞り入れるようになった。 EDAの 手 法 を い ち 早 く 取 り 入 れ た の は MINI‑ i s p l a y ) を出力するよ TABであるが、 BMDPも 1979年版から P2Dが 幹 葉 表 示 CStem‑and‑Leafd うになったの SASでは UNIVARIATEが l o t,ある 去 を 出 力 す る し 、 箱 ヒ ゲ 図 (Box Whiskerp 市 c h e m a t i cp l o t )後出力するプロセジャーもある。 P‑STATも最近EDAの手法を取り入れている。 いは S ( 4 ) C o x,D.R.( 1 9 7 2 ),R e g r e s s i o nmodels品n d L iお t a b l e s,JRSS,I B,vo1 .33,PP.1 87‑220.乙れに触れた テギドストとしては、 K a l b f l e i s h&Prentiω(1980),Wiley,L a w l e s s ( 1 9 8 2 ),W i l e yなどがある。 9 8 1 )、 くのテキスト(訳欝も多 Lウ が 出 絞 さ れ て い る 。 ケ ン ド ー ル 著 、 奥 野 ・ 大 橋 訳 (1 f多変緩解析 J、矯風館の訳者追加参考文献を晃よ。 ( 6 ) T u k e y,J.W.( 1 9 7 7 ), B x p l o r a t o r yDataA n a l y s i s,Addison‑¥ 号 、s l e y . ‑11

15.

( 7 ) そ大輪に取り入れたプロセジャーであり、回帰係数の推 定に大きな影響を与えるケースや 外れ儲・緊常値"を探索するための統計量を数多く出力する。 また SASの REGi 土 、 B e l s l e yIつ の 治 金グラフイツク機能の充実 ラインプリンター出力ばかりでなく、グラフイツク出力心機能をもっ統計パッケージも培え てきている。 SAS/GRAPHは現存の統計パッケージの中で、おそらく最も強力なカラー・グラフ イツク機能を持っている。 GENSTATも、グラフイツク機能を持つように拡張されるらしい。 SPSSも、既にカラー・グラフイツク機能を脅している。 @会話機能の充実 BMDPの 開 発 協 力 者 A .F o r s y t h eは「良いパッケージとは、イ長定したそデルとデータとの食い i s i デ … タ 解 析 に 際 し て ap r u o r iI と復定さ いぞユーザーに知らせるものである j と述べている o れる種々のそデル て、異 分布の正規性、線型モデルなど と現実のデ…タの悶の食い違いを検出し パッケージは強力 とある構造を 探索的に"謂べていくのに、 やデ…タの背後 l の機 つようになっ のヴアージョン SCSSが発表会れている。 の統計パッケー な武器となる。パッチ使用が原則jであった BMDPでも、 P2Tは f こ。また SPSSについては、 . . の機能を持っととが不可欠となろう。 ジi 立、持らかの形で 豆大化"のもたらす弊 〈汎用〉統計パッケージが務品であり、しかもその開発・保守に大きなコストがかかるとと を考え合わせれば、様々な分野の多数のユーザ…の要求に答えるべく、巨大化・多機能化して いく乙とは避けられない。しかし、 ないだ ζ れ は ユ … ザ ー に と っ て は 必 ず し も 好 ま し い ζ ととは設え ろう。我国における統計パッケージの現況と問題点号をまとめた論文の中で、水野ら{事)I 立 、 パ ッ ケ ー ジ 利 用 者 を 大 き く 二 つ の 型 に 分 け て 議 論 を 進 め て い る 。 乙 ζ では彼らにならって、 それぞれの裂のユーザー毎に、巨大化の弊議とさ表者の設をえる対応葉を述べてみよう。 ユーザーの の裂は、統計手法についてのま禁解も深く、また余裕さえあれば自ら解析用プ ログラムを欝く ζ ともできる 準専門家、ベテラン・ユーザー"である。*野らは、統計パッケ ージが誕生する致問として、ニエーザーの ( i ) 計算労識の魚般の軽減 〈お各種統 プログラムの提供 への要求を挙げ、<:の却のユーザーが統計パッケージ l と期待するむは主に{りの点であると結べ ている c 確 か に 、 開 デ ー タ の チ ぷ ツ ク ・ 編 集 か ら 結 果 の 解 釈 に ま で 至 る デ ー タ 解 析 の … 速 の 流 ( 7)Be l s l告y,D.A.,Kuh,E .& Welsch,R . E .( 1 9 8 0 ),R e g r e s s i o nD i a g n o s t iむs,W i l e y . 1回 国 際 計 量 生 物 学 会 (1982) における BMDPの 入 問 者 向 け 講 演 ( 8 )第 1 (9)*野 欽 司 、 大 鰐 昇 、 桂 康 ‑ (1978‑1979) ,統計パッケージ① 10‑11、 と く に 岳 と 合 一1 2 ー ャ ⑥、②、住、 v ol . 岬

16.

れ(結果から原データを見直すというフィードパックを併う乙ともしばしばである)を一体化 ・効率化する上で、汎用統計パッケージは強力な道具となる。また最近では、一組のデータ ζ l 数々の手法を適用して様々な観点からデータを要約する乙とが普通であるから、乙の型のユーザ ーにとってもグラフイツク機能も含めた多様な手法を統計パッケージが備えている乙とがもち ろん望まし ~'o そして、乙の型のユーザーが巨大化した統計パッケージを使用するにあたって 最初になすべき乙とは、自分の扱う分野のデータに適した、あるいは頻繁に利用するであろう 統計手法を選び出して、その特長と限界を知り、 生きた"実例を通じて センス"を養う乙とで あろう。乙の穫の作業は、 SASの よ う な 型 の 統 計 パ ッ ケ ー ジ に 対 し て 特 に 必 要 と な る 。 たとえば、 SASの 分 散 分 析 用 の プ ロ セ ジ ャ ー (GLMな ど ) で は 、 要 因 効 果 l 乙対する平方和が 3‑4種 類 出 力 さ れ 、 要 因 組 合 わ せ 毎 の 繰 返 し 数 が 不 揃 い な 場 合 に は 、 そ れ が 異 な る 値 を と る ・ の が 普 通 で あ る 。 と 乙 ろ が 、 乙 れ ら の 平 方 和 の 計 算 法ζ l対 す る 説 明 は マ ニ ュ ア ル に は な く 、 適 当なテクニカ Jレ ・ レ ポ ー ト を 読 む 乙 と が 必 要 と な る 。 乙 れ ら の 平 方 和 を ど う 解 釈 す べ き か に つ いては、 SASユ ー ザ ー 会 (SUGI) で 研 究 論 文 が 発 表 さ れ て い る ほ ど で あ っ て 、 サービス精神 豊かな "SASの 出 力 と 計 算 内 容 、 そ の 背 後 に あ る 理 論 を 熟 知 す る に は 、 か な り の 研究"が必要 である。そして、乙のためには統計専門家の協力が不可欠であろう。 一 つ の プ ロ グ ラ ム で 一 通 り の 解 析 が 行 な え る BMDPの よ う な 型 の 統 計 パ ッ ケ ー ジ に も 、 実 . F o r s y t h eは 、 BMDPが目ざす今後の方向として、 は大きな問題が潜んでいる。前にも紹介した A ( a ) 図的表示の重視 ( b ) ロバストな手法の採用 ( c ) 良い"検定法の採用 を挙げている。 (a)はともかく、 (b)と(c)とは ・ ah 曲者"である。確かに で、ロバストな手法は極めて有効な道具である。また、 外れ値・異常値"を検出する上 健常者"の群を地域間で比較する場合 のように、データの大部分が従うと考えられる分布型について比較を行なうような場合にも、 ロバストな手法は有効である。しかし、ある特定のサンプルのもつ情報を少数の(ときには l 個の) ロバスト"な指標で置き換えてすませてしまう乙とには問題がある。 極端な例であるが、 術平均よりも 健康度"を測る指標がある集団の個人毎に測定されているとしよう。算 乙平均を計 安定した"ロバストな指標、例えば両端の値 5 %ず つ を 切 り 捨 て た 後 l 算する 5 %トリム平均を求めて、昨年より今年の方が、乙の集団の たらどうであろう。乙のような場合には、健常とは言えない 健康度"は向上したと言っ 異常"な個人をまず検出して(ロ バストな指標を用いて基準化する乙とがしばしば有効である)、極端に悪化した個人が無い乙 とを確認した後、 (必要ならロバストな指標を用いて)ほぼ健常とされる部分の比較を行なう べきであろう。ロバストな手法によって、一見高尚なやり方で ごまかし"がなされ得る乙とに 注意すべきである。 ( c )の 例 と し て 、 分 散 の 一 様 性 の 検 定 に つ い て 述 べ て み よ う 。 分 散 の 一 様 性 の 検 定 と し て は 、 B a r t l e t tの検定、 H a r t l e yの検定などが有名であるが、 BMDPの 1 9 8 1年版では、 B a r t l e t tの 検 定 1 3

17.

は fデータの正規性からのズレ!r.敏感であり、ズレがあると有意になりやすい J (マニュアル pJ13) として、 より良い"( F o r s y t h e後) L e v e 加わ検定絡を用いる乙とを薦めている。実際、 P3D、 P7Dでは L e v e n eの検定の出力のみがな 2 きれているようになっている。しかし、検定の良 さとは対立仮説をどのように想定するかに依るのであって、 i B a r t l e t tの検定でも有用な常事長が 得られるのであり、それを一方的に護き換えるのは摺る。どの検定を用いるかは、ユーザー自 身が判断すべきである。 J (竹内容東大教捜談〉 ζ の点で、正規スコアの計算に 3種類ものオ プシ 3 ンが用意されている SASとBMDPとは対期的と設えるだろう。結潟 BMDPGD場合も、そ れぞれの(とくに 新しいつ手法について、ユーザー側 と限界会研究しておく必要があ る 。 dて、ユーザーのもう一つの型は、いわゆる初心者を含む、水野らの 会借りれば「パツ ケージという手軽な手段によって顕在化された j ユーザーである。そして、 ζ れらのユーザー "が統計パッケージ有害論を生み出した、と水野らは指織している。 の 濫照・ ζ れらのユ . i i )の鶴言語であり、乙れによって多変醸解析な ーザーが統計パツケ…ジに鋼待するのは主に蔚記 ( どの 高変"な に普及・大衆化したと言える。筆者はこの大衆化の傾向に は 唱えるつもりはないが、その で水野らの指摘する を 当 有害論"も認めざるを得ない。簡単に統 なステップである吾的の特定が疎かなままに、とにかく 計手法が適用できるために、最も に見られるし、データの(探索的)吟味を怠った 計算を行なってしまうという傾向怠え 自のみのごつの手法のみの結果から、強引に 結論"を導いている 応用例"もしばしば留にする。 また、 BMDPについては日本語のマニュアルが無い ζ と(日立から BMDP解 説 編 と い う マ ニ ユ アルが出ているが、乙れは 1 976年の販に対するものである)、 SASは英文マニュアル自体が不 親切であるので、統計手法 ζ i関する充分な知識会初心者が得る ζ とは難しい状況である乙とも である。一つの例を挙げよう。 ある研究会で SASのクラスター分析のプロセジャー CLUSTEI ミを照いた応用務の発表を伺っ た 。 (ζ の時点で筆者は SAS のユーザーではなかった。)クラスター分析について勉強したも のなら維でも、 によって結果が大きく変化する可能性がある ζ とを知っている。乙のとき 用いた手法の名称を尋ねたと乙ろ、 ζ れは、 J o h n s o nの方法"であると 2 蓄えが返ゥてきた。 SASのマニュアル中で手法 l と関する参考文献として J ohnsonの論文が挙げられてい たためであるが、 ζ の論文はいわゆる の方法"という は 凝集型階量的手法"全綾に轄するものであり、 しない。マニュアルをよく読むと、実は 最長距離法( Com p l e t eL i n k a g e法) "後期いているととが判明するのだが、初心者にとっては、 J o h n s o n 連結法、 ζ の間述と 最長距離法"を結び、つけるのはやや難しいかもしれない。 米冨では SASや BMDP!r.関する講腎会が獄後されているようだが、上記のような初心容によ ( 10 Brown, ル f .B .& F o r s y t . h e, A .( 1 9 7 4 ), Robustt 告はsf o rt h e e ; q 国 l i t yo fv a r i a n c e s, 主 主 主 主 , vol.69, p p . 3 6 4 ‑ 3 6 7 . ‑14… 訓削除

18.

る 議f f l '誤用"を防ぐためには、統計専門家の協力による知識の普及が不可欠である。とくに、 の数理的説明のみでなく、異常値のチェックをはじめとする手法適用の前段階、解釈結5 起 をどのようなアクシヨン ζ i結びつけるかにも力点を震いた データ解析の流れの中でのパツケ ジの利用"について教育がなされることが望ましい。 さで、水野らは、統計パッケージのあるべき一つの姿として、医学データ・社会調資デ…タ などのような傾域別に分化した影皇室を挙げている。そして、統計パッケージに関する現殺の問 題そ解決するには、実際にパッケージを設計し援供する乙とでrr:;えねばならない、と結論づけ ている。しかし、既に触れたように、パッケージの製作には人的資源、時間、経済的費用い 1 : 行 れの面でも大きなコストがかかり、更に保守を行うためには、とくに経済的支躍が継続的 1 なわれる必要がある。統計パッケージの露発や研究に対する学閉的評価が残念、ながらそれほど 高くない我国では、 剣嗣h ζ れらの密難を乗り謹えていくことは極めて難し ~\o 一つの対応策として、 現夜の汎隙統計パッケージの利用技術をユーザー側で蓄積していって、乙れそ 自分のもの"と していく ζ とが考えられる。 SASの よ う に ユ ー ザ ー に よ る プ ロ グ ラ ム 追 加 が で き る パ ッ ケ ー ジ 会用いれば、必要な解析手法を額次追加していって機能の拡大と深化を行なう ζ とも可能であ る 。 ζ のような対誌、策が現状では最も現実的であると筆者は考えている。そして、 作業の露日産物として、ユーザ ‑(J)レベルζ i 応じた通常のマニュアル以上の ζ のような 指導書"が生れれば、 統計手法の真の意味での普及に貢献すると乙ろ大であると考えられる。 大型計算機センターの褒状 9 8 2年 3月時点、で利用可能であった統計パッケージは 東大大型計算機センターで 1 • SPSS (1979年の第 8版〉 ・BMD、 BMDP、 CSTAT a 削 除 • SALS (最小 2乗法標準プログラム) • TIMES2 (日立劉発の時系列解析用パッケージ〉 • PPSS、 PPSS2 (日立開発の数量化手法のパッケージ〉 であった。科病鎮度の統計を表示 5I と示すが、 SPSSが若手を抜いて使われている ζ とが判るだろ う。統計パッケージの内では 7 5 . 4% 、 数 値 計 算 〈 最 適 化 手 法 、 行 弼 演 算 、 微 分 方 程 式 な ど 〉 や 顕形出カライブラリを含めた内で 1 3 . 3%という手J I 用頻度の高さは、筆者にとっては驚異的で窓 えある。( 濫鴎"の非難もあるらしい。)乙の理由は、日本語による 指導書"凶が出援されよく 売れている ζ と、指導員が配備されるなどセンター鶴の対応が整っている ζ とが最大の型自で 為る。また、 SALSの利用頻度が高いのは、情発者がf1言言葉大に所属しており、議んに普及活 動が行なわれたためである。 と ζ ろで、上記の BMDPI立 、 1 976年の複を日立が保守しているものであり、また SPSSにつ いては(異論があるかもしれないが〉集計用パッケージとみなす ζ とにすれば、 日三三宅倒 ( 1976, 1 9 7 7)、 r s p s s統計パッケージ I、 ITJ 、東洋経済。 最新"の汎期 phd

19.

表示 5 東大大型計算機センターにおける統計パッケージの利用 プログラムライブラリの利用頻度 東京大学大型計算機センター プログラムライブラリ研究室 1982年 1月 30日 現 在 順位名称 備考 利用頻度/月 1 MSL/MSL2 13217 数値計算 (MSL 5948.MSL2 7270) 2 GPSL 10760 図 形 (XY プロッタ.グラフィックス) ( 含 BGSP.HGSP.PREV1EW う 3 SPSS 5430 社会科学統計(新版も含む) 4 TL1B 3231 基礎(東大開発 A‑X) 5 TL1BY 2169 応用(東大開発 Y) 6 SALS 1073 データ解析(新版.倍精度版も含む) 7 BMO/BMOP 943 統計 (BMO 2 64. BMOP 597. CSTAT 82) 8 PPSSIPPSS2 802 数量化理論 (PPSS 52~ PPSS2 276) 9 DDS3 521 連続型シミュレーシヨン 1 0 MPL 450 線 形 ・ 非 線 形 計 画 制 PLLP 320.MPLSUMT 130) 1 1 GPSS 319 離散型シミュレーシヨン 1 2 SAP4 297 有限要素法(動的解析) 1 3 AM1SPACK 284 "7クロ副譜集 1 4 SOS 249 システム・シミュレータ(DYNAMO系) 1 5 CORE 245 汎用図形処理 (ACM/S1 GGRAPH CORE準拠) 1 6 恥1PS2 143 数理計画法 1 7 1SAS2 141 有限要素法 (NASTRAN 系) 1 8 OYNAPLσr 118 透視図形 1 9 XRAY 85 結晶解析 2 0 SOS1 82 簡易図形処理 2 1 SSAP 32 2 2 ECAP . . . . . 類 分 利 用 回 数 比率(労〕 数値計算 18 , 114 4 4 . 5 4 有限要素法(静的解析) 図形処理 11 , 205 2 7 . 5 6 30 回路解析 統計計算 7 , 202 1 7 . 7 1 2 3 T1MES2 27 時系列分析 2 4 ]AMOL3 9 分子計算 応用・シミユ レーション等 4 , 139 10. 18 2 5 MPLS1M 3 シミュレーシヨン副譜集 合 計 5 十 40 , 660 100β0 40660 〔月間平均ジヨーブ数 109000) ‑利用回数/月の欄の数値は、 1981年 7月 1日より 1982年 1月 30日の区間の利用回数 (ファイル定義の回数)を 1カ月当りに換算したもの. .CORE は、 1981年 11月 25日より公開. 1 . 14 ( 1 9 8 2 ) .N u 3 より引用 センターニユース、 Vo 1 6 '

20.

統計解析パッケージは東大では利用できないという状況であったが、 1 9 8 2年 4月 i ζ S A Sが導入 された。しかし(表示 5で BMDPの利用頻度が S P S S ' ζ 比べ綴端に眠い乙とから本唆されるよ うに)、 S P S Sの 場 合 の よ う な 適 切 な 対 応 接 童 が と ら れ な い と 、 こ れ ら 優 れ た 続 計 パ ッ ケ ー ジ は あまり科用されないか、あるいは誤附される危険も多分にあると考えられる。 これまで述べてきた統許パッケージおよび東大大型計算機センターの環状を鯖まえ、筆者ら は f 統計プログラム・パッケージ研究会 j を設:立し、本年 2月からその活動を鵠始している。 ζ れは A SとBMDP) な ら び に そ れ ぞ 利 用 し た デ … タ 解 析 手 詰 ・統計プログラム・パッケージ(主に S の研究 a・ ‑応用事例の検討を通じた統計手法ユーザーと統計学研 との相互交流 を践的としたもめで、取りあえず月 1窓程農の研究集会を関録していく予定である。 会の成果が、先に述べた 統計手法の普及"と統計 ていく ζ とを念願する次第である。 a 闘 恥 ‑17‑ ζ の研 究の新しい方向を探るよでの刺激となっ

21.

PROC AIDの開発 三井情報開発株式会社総合研究所 木村 豊 華 経 1 . はじめに AID(Automati c I n t e r a c t i o n D 抗告むt o r )分 析 は ミ シ ガ ン 大 学 の サ ー ベ イ リ サ ー チ セ ン タ ー で 開 発 t きれた、サンプル調斎におけるデータ分析の i手法である。データ分析は通常、その分析手緩として 2 つの段構がある。第 lの段譜はデータ解析の過躍を過して、理論的あるいは仮説みして最適なモ デルの選択過程である。 第 2設階は選択されたモデルに対して統計的な麗からの評価を行う。 綱 同 AID分析は第 1段階における強力な分析手法であり、量的な被説明変数と質的な説明変数との 鵠の関連伎を見つけ出し、 ζ れを二進木(バイナリートリー〉機造を持つ嬰間関連図として 現するものである。 すなわち被説明変数としては技人の大きさ、説鵠変数としては年齢、性別、出身地、従業 上の地位等あらかじめカテゴリー詑された要因を用いる分析技法である。 AID分析の手 1 ) 慎は説明変数の£わから被説明変数の差異を最もよく表わす饗践を選び、その 国で元の集部を 2分割し、以下分割されたそれぞれの副次集簡について時機な手緩を繰り 幾つかの集聞に分観していく。 返し、統計的な打切り条件を満すまで、元の集部省b 乙の結集元の集田安説明変数の組み合せによって被説明変数の鎖に な差がある代表的 集団に分割するととが可能となる。 AID分析悶プログラム i 立、当初当研究所で行われた数多くの社会議資プロジェクトの分 ・ a 析のために鵠発された況調集計パッケージ ( S O R I S I )の拡張機能の 1っとして諮発された。 9 8 2年ζ i高 護 な 統 計 分 析 及 び 統 計 デ ー タ ベ ー ス 利 用 O El的で、 のちに業務の拡大に伴ない、 1 SASが導入されたが、 SASの利用率が増加するに従い、ユーザから SASで 直 接 AID分析を行い たいという強い要求が生じた。 AID/SASは以上の経過から開発されたもので、従来開発された AIDプログラムを PL バイン タ…フェースプログラムによって SASとリンクしたものである。 AID/SASは SASの拡張コマン ドとして PROCAID'の名のもとで、 'PROCGLM'あるいは 'PROC REG'と関様のコマンド 体系で利用可能である。 2 . AIDの理論的表現 AID分析の数学的な表現は以下の滋りである。 (1)対象となる ( P a r e n tGroup)を L とする。 Lそ 2つの副次祭聞に分割したとすると、被説明変数の平 一1 9‑ (yL)からの縁差の

22.

和 (SSL:全体の平方和)は次式で表現される。 すなわち全体の平方和はグループ関の平方和 (BSS) とグループ内の平方和 (WSS) の和 として表現される。 N L 円 b 冒 し QU 1 2 え) (Y La a=1 BSS ト ベ WSS BSS NL1 WSS Ny 2 N 守2 + N y2 L1 Ll L2 L2 ) d崎恥 LL y NL2 (Y ‑ y )2 aL1 L1 ザ ト (YaL2 a l 2 Y ) L2 昌=1 之江 S S : 平万和 日S S : グループ問 WSS: グループ内 下 f 方和 数の平均 被説明 N: 観 測 値 えられたカテゴリ ( 2 ) AIDは各説明変数について、元の集団を をいくつか集め、グループ を 2つ に 分 割 す る 場 合 的 BSS を計襲撃する。 こ の 結 果 カ テ ゴ リ ー の 組 合 せ に よ っ て で き る い く つ か の 分 割 の 中 か ら BSSが 最 大 と な る 説明変数とカテゴリーの組合せを選び、乙れによって元の集毘を分割する。 ( 3 ) 乙の分割を以下 ζ l述べる条件 ζ l 該当するまで日う。 会分譲1さ れ た グ ル ー プ の 大 き さ が 、 指 定 し た 数 よ り 小 さ く な っ た OBSS/SSが 一 定 の 績 よ り 小 さ く な っ た 場 3 . PROC AIDの プ ロ グ ラ ム 構 造 PROC AlDは次の 3つのサブプログラムで檎成される。 (1)コマンドパーザーサブプログラム ζ の サ ブ プ ロ グ ラ ム は 、 ア セ ン ブ ラ マ ク ロ で 脅 か れ 、 PROCREGと同様の S ASコマンド解 釈機能をもっ。 川崎 内 内 ︐ ︐ υu

23.

( 2 ) AID/SASイ ン タ ー フ エ ー ス サ ブ プ ロ グ ラ ム ζ のサブプログラムは、 PL /Iで書かれている。 ζ と で は ま ず SASデータセットそ読み込み、 テンポラリ…ファイノレに AIDサ ブ プ ロ グ ラ ム の た め の 情 報 一 選 択 さ れ た 変 数 名 及 び そ の 、各変数の設大カテゴ 1 )… サ イ ズ 、 印 鶴 見 出 し 等 一 会 作 成 す る 。 ( 3 ) AIDサ ブ プ ロ グ ラ ム ζ の サ ブ プ ロ グ ラ ム は FORTRANI Vで書かれ、 する。アルゴリズムは当 AID分 析 を 社 で 関 発 dれ た も の で 、 ピ ッ ト ハ ン ド リ ン グ と ツ リ ー 構 造 デ ー タ 操 作 に よ り 、 実 行 速 度 ζ 本 サ ブ プ ロ グ ラ ム の ジ ェ ネ ラ Jレフロ の 高 速 化 と コ ア サ イ ズ の 節 約 を 計 っ て い る 。 図 1I チャートを 。 関 1 AIDプ ロ グ ラ ム の フ ロ ー チ ャ ー ト .. ・ ah 4 . PROCAIDの 使 用 法 及 び 実 行 例 1) コ マ ン ド PROC AID STATE~偲NT PROC A工D; MODEL Y =Xl X2 X3 X4 ITERM = 0.001 M工NGRP 30;R むN; 盟 ‑ 2 1

24.

Y : 被説明変数 (数値変数のみ指定可能〉 X I ‑ X 4 : 説明変数 (一一一一) I 変数の数は 3 0まで ο 各変数のもつカテゴ ) 1̲ 数は 2 0まで o / (…… TERM: 終了条件(拘パラメータ) ラメータより jさ ければそのグループを分割対象としない。 ) デフォールト{直は 0 . 0 0 1である。 I 1 MINGRP: 最小グル…プサイズ a醐恥 ( 借 問 す る グ 一 … が と の ラメータより小さければそのグループを分 0である。 割対象としない。デフォールト憶は 3 2) 実行f91j AID/SASのアウトフ。ツトは 2種類ある。 1つはすべてのステップのプルーフリストでもう lつは最終的な饗盟のツリー機滋である。 関 2はツリー構造の列で品うる。乙のケ…スでは日本の家計収入の分析各行っている。 表 1I ζ ζ の分析で使われた変数むリスト号告示す。 Table 1 v i 盆r iables in theAIDanalysis V a r l a 抗 en 棚@ 古~器三 we8亙fTenure‑of])welhng l ) Ow endhouses 2 3 ま. e n t e dbous 畿a (Private) 4 Dw ellingprovidedby まe ntedhouses(決l b l i c ) ︐ ︒ aJ'e e時 l o y僻 Re nted roo 田a ー 1 2 3 4 5 昏 7 S 9 1 0 指己主盟主 号 岨2 4years 事 y ears 25‑2 3 ( }34years 35ω39years 叫 4y ears 40 4549yeara s 。 崎54y ears 5559years 品 。 崎 毒4y ears 64years over Dep endentvariable 時 工 総dustry ま. e g u l a rworker 躍p orarywor 註e r Te 智o rker private office‑ 田 r ker Official office‑ Mining Cons主芝uction Ma nufacturing Wh olesale, retail Finance Merchants, artisans Transporti 酒i nistrators 関 etc. Privatead Cor 予o rativead 田i nistrators Gas , water etc. Services 苦r ofesstional servi 時議 Ot 為e rs PubHc service篤 却oo ccupation Others ︐AU aoaw V i l . i ' i i 6 I ena髄 器官お古言 O : c c 時抗i on 主主主主五百削除1'l)r 1se 時o use 亙 占ld盟i e m b e r s 1 e2宮 崎p ersons 30 輸品事 9persons 500時事事宮 person鍵 1000persons 0l e r Go vernment 1person . 2persons J persons 議o ns 4 per 5 persons 6抑 制 捕 容 7P! r 。 録nsσver 働 、 欄 欄 Yearly inco 臨 { 紬i ti s 1, 000yen) ‑22… Earners 1person . 2persons 3 persons 4 persons over ・ ・ a

25.

i ~~~i ~iI i~ iÏ~ 誤認怒川 叩 誤認語読ま . 1 ‑ NehH3鳩 JFh a IRj l ! j i ll i 1 1 1 1 1 ! j j j i l l i g i l l i f i l l j j j i l l i i j i l l i i i j i l U j i j i i i j i l l i i i l i j i l i t a i i i j j i l l!?j'i::ifle+!::ii:i-!:::!?:i-i:::2:i++!:::ii::! … r::~:r] る ! : 1 1 i g i i i i i i i j t z U j i j i L ! ? i i L 以 降│ ! ! i l i i i l 襲 撃 │ 退 陣i i i : ! こ vii!:::i'φI::::~........:~......~::::l....+φ r:::~........:~......~::::I....+ るr:::~........:t....~::::r..+ l i j i l h i j i l 殺 さi i j i l i j l i t i 1 1 ............................;~.............................l. ....I..:.~........................~......................~::::I....~

26.

各種判別手法を用いた医摸 タ解析の標準化 (乳房 X線 橡 デ ー タ を 題 材 と し て 〉 設商コンビューターサーどス紛 新村秀一 大阪野立成人病センタ… 鈴木議…郎、小山博記、中西克己 1 . はじめに 震療の 定において、多変遺解析を用いたデータ解析は、最も強力で役にたっ手法で ある。 し か し 、 乙 れ 設 で の 多 く の 研 究 は 、 研 究 者 の な れ 親 し ん だ 手 法 の lつ を 単 に デ ー タ に 適 用 ・ ah した桝とか、解析の手 1関や結栗の表訴法 ζ i適 窃 さ を 欠 い た も の が 多 か っ た 。 乙 の た め 、 多 く の デ … タ 解 析 的 事 併 が 報 告 さ れ て い る κも か か わ ら ず 、 解 析 結 果 の 他 と の 比 較 や 、 デ ー タ 解 析手法の優劣の検討が行なえなかった。 そ乙で本研究では、乳房 X 線像の卒J I別問題をがj として、代表的な判別手法を尚一データに 適用し比較検討する ζ と 、 ま た デ ー タ 解 析 を 一 連 の 作 業 手 類 と し て 標 準 化 す る ζ ととした。 なわち、 岳情況奇数表等でモデル{とする乙とにより、客観化と普 i 磁化を許る。 o医 師 に よ り 分 頼 さ れ た 概 念 的 な 群 は デ ー タ の 分 布 に よ る 群 と 奨 な っ て い る 場 合 が 多 い の で 、 主成分分析号長期いて標本を題化する。 1別手法会適用し、判労] 1結 5 誌の違いをアルゴリズムの違いと結びつけ検討する。 争後数の半] 争 そ の 結 果 を R O C曲線で医師診断と併せて比較評価する。 ・ a 重要である。 以上のような標準化はデ…タ解析のような学際的額域で特に 3 ζ れにより、研究 時信心短縮を計れる乙とと、後三部と解析者の翰主主期解と協荷作業が容易になる ζ との他、解 析結果の普選化という財産が蓄積できる。 2 . 研究材料 2 .1 乳臓疾患患者の検ままのフローと乳房 X線写真 産療における患者のフローは知識や検査技術の進歩により変化するものであるが、昭和 4 0 年代における大限府立成人病センターの外来を訪れる乳腺疾患患者に関しては、おおむね次 の如くであった。認1ち約 90%の 患 者 が f自 分 む 乳 爵 に 凝 り が で き て い る j という自覚症状を 訴えて外来を訪れ、 ~1 のような流れをたどって診断される。 RU 9u

27.
[beta]
留 l

における

」
工
戸Jf

骨経過観察

乳線疾患診断過程

綴量三

性

の位謹づけ

性→経過察
経過観察
悪性
生 検
悪性一→治

療

良性一一+経過観察

!
!;
,
)

ι
'
<
:

外来患者

懇

山

/V

性?

自覚症あり 90%
告覚症なし 10%

性

最初の検査は

部による敷診である。

検

団 訂 [ 悪 性 」

ー
斗

悪性一一争治

療

良性一一+生

検

制〈:

検

悪性一一ゅ治

療

ー治

療

療

‑

ζ れにより謹癒の存薮を確認すると共花、その悪性

度についても「臨床診断 j 後行う。異常なし、良性疾患であると確診しえたものを捺き、約
を決めるために行わ

3害J
Iのものが X線による乳房撮憲をうける。乙の乳爵撮彰は生検の

れており、しかもその決定に当って龍床診断も参考 i
としている。
ζ のようにして引続き生検を受け、あるいは治療(大部分が外科手術〉安受けると

f病 理

診断 j が確定する。
乳爵撮影の ζ の様な位欝付けからして、我々の研究対象は、比較的高い頻度で乳がんぞ含
んでおり、計量診断の検討のために病理診断が確定している症例のみを捷吊すると、その額
向は更に勤長される ζ とになる。しかし他方、 X線診断で「著変なし j とされでも臨床診断
後根拠に生検;dれている症例ら亦多く、 X線診断の限界は考慮 8れねばならない。
川削除

2
.2 乳がんの X線所見

手L
I
芳X線写真の主嬰な所
見とその性状分析及び存在
頻度を表 1I
C示した。
乳腺捨影は

表 1 乳隠 X線写真の主饗所見・性状分析・存在頻度
主要所見

設

性

事1I軍費毒事3

分

スリ怨ラス槍.灸

割T

し
、
。

(Ha1o

)t
z
.

い.r:t軍事皮 .
i
:
炎
竜馬.r:t軍事度.不鮮明
一,呼損害事度,不均一
り
し,あ
主~ . 煩 同 君g 不 渡 益
り
し,あ

匹
30.8% 15.99

右灰決活費量

務陰影と石灰沈潜像と

綴
〈 分 布 の 広 a) 1
提
〈奇襲々の大 ~a)

分であり、表 1I
と記載した

なっている。乙のようなデ

大 ,
費
量
い.広

、

総.経費量繍
L

〈
〉少
数.j;
聖
E
重
量
{倍々の形状〉内
!l't.本書l !
l
'
t
(分織の覇軍閥〉 鍾窃調書量刑,糊富島紛ト
〈沼1IQ)lt)fI後〉向
量産.不均実
きの均等性〉 大小均一.大小不!毒
〈大i!e

は巽常所見の中核をなす部

性状がその懇性度の指標と

災後鮮

75.5% 59.5~彰
〈 陰 影 諸 島 Il!:>温
〈辺緑の鮮明'1>鮮
母
〈湯里誌の鈎等性〉 聖
〈量生約主主突起〉 な
《高島章~(/)形状〉 内

見であって異常所毘ではな

懇健軍事

微調理目様

1
1繊 陰 影

をなす所

存 在 害 車 問E

lU
町陰影

韓常あり
災骨骨えまし.J

企 5%

0
.5潟

宜主陰影

A官官なし.異常あり

5
.
2
手
話

2
.1
9
揺

‑26…

28.

タの階層鋳造は、 データでよくみられる伊きである ο X線選過肢が背芸まとまったく問 とお沃 である臆療は陰影を作らなし、。乳がんの石炭沈着は腺腔内 K貯溜した分泌物、主参出物 i が沈著した微細なものである ζ とが多い。 と血管陰影の異常とは存在頻度が少ないので採用しなかった。 E 定費陰影の 2 . 3 計量診断に使用した痕Ol J 大阪時立成人病センターにおいて、昭和 4 3年度から 5 1年 度 迄 に 、 生 139件の乳房撮影が行 わ れ た 。 そ の う ち 結 綾 診 断 の 行 わ れ た も の が 902件あり、そのうちコード化 いえた 664 件 a r c i n o m i aの み で あ り 、 良 性 疾 患 と し て は F i b r o a のみを研究材料とした。主主性喪患としては C ‑ d号nomaとAd 程n O S l Sが大部分ぞおめていた。 表 2には懸場除影と E灰 沈 所見の有無月J Iの寵伊i 数を示した。 というこつの 2 腫蕩陰影<!:::tJ沃沈着の存夜による分類 ・ (( )内は癌〕 ah !活法沈着 あ り な し 針 護蕩除ば¥ あ り 101( 6 8 ) 340(1 4 8 ) 441(216) な し 46(持 〉 1 77( 51) 223( 7 0 ) 計 二つの 147( 8 7 ) 517(199) 664(286) 8% 所 晃 が 共 に 存 在 し な い 症 前 が 177件 存 在 し 、 か っ そ の な か に が ん 窓 鰐 の 約 1 が 含 ま れ て い る こ と は 、 乳 が ん の X線診断の騒界を示すものと考える。今田は、 ζの 1 77例 I成繍は少し割号│いて考える必要がある。 を綜外して検討したので、料努J 3 . 3 .1 解 析 対 象 表 1I ζ 示した主要所見のうち、手L 腺絵要三と a 陰影およびお灰詑着像の各位状分析を説明 変 数 と し 、 総 環 診 断 か ら 悪 性 群 と 良 性 群 の 2群そ 陰影または は し目的変数とした。しかし、性状分析 詑 着 像 の 認 め ら れ る も の の み K行っているので、 ζ の二つの 所見 の有無により有効な情報の組み合せはまったく異なってくる。そ乙で、同所見がみられる (101例 ) 、 種 蕩 詮 影 の み が み ら れ る 層 (340例〉、石版沈 4 6椀 〉 のみがみられる層 ( の 三 層ζ l 分けた。 3 .2 解 析 手 踊 以上 487例 ( う ち 、 が ん 235伊1 ] ) のデータの分 を 知 る た め 、 最 初 に 主 或 分 分 析 (F ‑ACTOR) 安 行 う 。 次 に 、 数 震 化 I類〈ブオートラン〉、ベイズ診断〈フヌ?ートラン〉、最 適判,ijI J ; または尤度法 ( FREQ) 、 2次料男J I 関数 ( DISCRIM) 、 FUNCAT、多 3 窓口ジステイク モデル (LOGIST) を 用 い て 悪 性 度 診 断 ( 態 柱 、 良 性 の 2霊季初出 1 ] ) 佐行う。判男J I結泉の評価は、 師診断と共ζ i 氏 。 c共線を用いて行う。 … 2 7

29.

3.3 R 0C曲線 ROC曲線 ( R e c e i v e rO p e r a t i n gC h a r a c t e r I st IcC u r v e )を 及したのは、 L.B .L u s t e dの 決定む評備法として導入し である。 は、判別基準(判定J I境界点)を l点 に 組 定 す る こ と に よ り 得 ら れ る 図 2I ζ示 従来判別 す 2x2分 の何らかの績を附いていた。 半J IJ . lJ I 群群 性殺性性 悪臭 騒(陰︿ ﹁│ii!iL 外的基準 臨性 態性 真の隣性 偽陰性 TP F N 偽揚性 翼の陰性 ・ a rN F P イ 関 2 2 x 2 分議J I 2x2分筈J I表には、次の制約条件が諜せられている。 T Pト ベ FN 1 F P+TNニ 1 よって、 ζ の表のもつ情報は (TP、 TN) の組が (TP、 FP) の 親 等 で に代表され る乙とになる。 ROC曲線は、事J I別某準を変える ζ と に よ り 得 ら れ る そ の 点 の 軌 跡 で も っ て 表わされる。 4 . 結果 、 綱 4 .1 疾病分布モデノレ 表 1I と示した 自を、 2値 (0、 1)そもつアイテムに変検し、主成分分析後行った。 第 3主 成 分 軸 ま で の 累 積 固 有 値 は 3 0 . 4%であった。図 2I ζ 第 1と第 2主 成 合 輪 上 で の 国 子 負 荷量のプロット号告示す。黒丸は 媛、自丸は麗蕩閥、三角は乳腺陰影の項目を表わす。 , 図 3 ζ{ 司じネ頭上でのサンプル・スコアの分布を と 4はお灰層を、5と 6は 問中の 1と 2は 臆 を表わしており、奇数は悪性群を、偶数は良性群を表わして いる。 H 霊場層と般の 2群 が 完 全 に 分 離 し て い る ζ とが分る。 像のもっている 灰層を、 3 ζ の ζ とは、腫蕩陰影と石灰沈 の留が異なっていることを示している。 訳語と石灰層とが融 している理由としては、腫蕩陰影よりも石氏沈着後のコミ品ナリテイの方が緩が高い乙と から、腫蕩.訳鰯では撞蕩詮量三の が石灰沈着像の情報 l と敏 q 支されたものと考えられる。 この点に関しでは、医師の経験期とも合致しており、説 重視する鱗向がある。 ‑28‑ がある場合、石灰沈着後の方を

30.

、密 2に も ど っ て 考 え れ ば 、 第 1象 怒 に 位 霊 す る ア イ テ ム は 全 て 石 灰 沈 務 像 か ら の も の で あ り 、 第 4象 限 に 設 置 す る ア イ テ ム は 臆 務 陰 影 か ら の も の で あ る 。 こ の こ と は 、 サ ン プ ルスコアにも影響しており、腫蕩・石灰層は、石 f : ) ミ層の麗痩鱗にある。 3 関子魚荷量 1 . 0 、 旬 . 降 . • ・ . 、 . ・ .. ・ r I ̲. 明 1 00 Iw OO o 0o , .a A . . . . .. , . .l a 1 . 0 I A 畠 1 . 0 0 0削. ' 1a 。 。 X0 0 剣恥 O マ 00 ‑ 1 .0 国4 サンプルスコアの分布模式図 第 1敏 ・ ah 務2 ' 首 長 2 . 0 4 .2 判 別 分 析 の 成 績 ‑ 1 .0 2と 疾 絹 分 布 モ デ Iレの結果から、勝場・石氏瞬、石灰層、日議場層の 3騒に分けて、怒性群 と良性群の 2群事J I男 J I分析を符う ζ とにした。 暫定J I手法ーとしては、数量北 I類、ベイズ診断、最適半J I別〈尤度法)、 2次辛苦 J J I J、 FUNCAT 、 多重ロジスティックを用いた。しかし、多重ロジスティックは症鰐数が多く総カテゴリー数 の少ない腫場!畿でしか解が得られず、{畿ではピボット演算の途中で溶ちた。 1)懸務・石灰層の宇J I別 結 巣 標 本 数 は 101伊jであり、 1 4アイテム 4 8カテゴリーであるので、 一2 9 1カテゴ、リーあたりの標本

31.

I 数 は 2i 9 J である。 全ての卒J I7 j1]結果を決 O C曲 線 そ 用 い て 比 較 検 したカミ密 5ζ t 際 締 診 断 と 数 議 化 I類の結 の み を 示 す 。 表 3に ま と め て 適 当 な 判 別 境 界 点 で の 辛J I別 結 集 そ 2x 2分 担 にまとめて し ? こ 。 FUNCATは 算時間がかかったので途中で打ち切った。 国 5 数量北 断と医師 断 の ROC曲 線 100* ‑ h ' 吋HJ判例︒品@何回匂 . 50 LH ーー+四一 a 般 量化診重量 柵.糊鍋働時窓締 2 ま 重 軽 og 50 100* 1 ' 1 1 , 1 $0 P osit込1'0 2) 石 夜 の判別 8ア イ テ ム 2 6カテブリ 数 は 46例であり、 であるので、 1カテゴリ <tたりの 数 は1.8例である。 ,す。 結 果 を 、 表 3と醤 6 ζ 関 6 化 診 断 と 医 師 診 断 の 及 。c 曲線 数 主0容量 鴫 d . . , e H ・ . . ゅ 腕 / t . 50 ‑ •ロ h 田山骨剛一 級量化主主重喜 …綱嶋崎…涯釘診霊長 0 9 60 1 ' 1 1 . 1 $ " POUt込1'. . 100* 内︿ υ ハ υ

32.
[beta]
3

半J
I

成

号
せ

績

詞 :~I :
2ヱ計三与えヰ三ヰ三

同閣引τ
;ヰヲ:苛せヰ三 344
ト
z
?
3)

.

層 の 事J
I男J
I結

6カテブリーあるので、
襟本数は 340例であり、 7アイテム 2

1カテゴリ

あたりの標本数

は1
3
{
初!と勉に比べて多い。
ロジスティックモデルは

結 巣 を 、 表 3と詞 7,乙示す。多
函 7

化I
I類と大

なかった。

化 診 断 と 医 師 診 断 の ROC曲 線

数

{短調臨月直}

@hpHUF

︒
"
吋

n問 enhLF

喜容

堂..
化診断
‑
・
・
"
・
困
問 ・霊
m

一ーー・鐙飾 t
合型軽

・

a

G

&0

O

100,
*

1
1
'
1
.1
8
0 Posit孟v
e

5

と今後の課

金

本

で

ような

者らが主
作

したかった ζ とは、次の点である。すなわち、

に定式化した

療データ解析そ次の

である。

1) 問 題 定 式 化 〈 モ デ ル 化 )
医療工学 (ME) は
、 医学と工

同

の学際韻域であるので、繁なった学詩分野の研究者の協

が必要となる。 ζ の と き 研 究 対 象 を 、 数 表 や 関

れらが疑分野の研究

を 尽 い て 客 銭 的ζ
i 普遍 f
とすれば、 乙

の橋わたしとして共滋の場を提供してくれる。

2)デ ー タ に よ る 疾 病 像 の 鴫 篠 化
毘の例では、寝床的ζ
i

えられた 1
7群を

て出発した。 とのような観念的に

性群と良性群の 2群 判 別 と し て 嫌 う ζ ととし

dれ た 群 に 対 し て 、 罰 有 知 識 に 基 づ い た デ

一3
1

タに対す

33.

る考察や疾窮分布の検討を欠いて、勝純 1と 2 群判別を行うことは謂婚が多 ~\o すなわち、図 4にみるように乳 x線 像 の デ ー タ は 、 病 理 学 的 に 設 定 さ れ た 群 に よ ら ず 、 腫 蕩 鎗 彩 と 石 沃 きにより、完全に分灘した 2つ の ク ラ ス タ ー を 車 成 し て い る 。 腫 沈 着 像 と い う 情 報 の 表 わ れ3 定型の悪性群であろうが、霊長師や患者にとっては感性群はただ 場型の懇性群で、あろうが、石 E 一つであるが、データ解析の立場からはこれらは異なった群として考える必繋がある。判 分 析 に お け る 線 形 判 別 関 数 の 影 響 が あ ま り に も 大 き い た め 、 そ の 前 擬 条 件 で あ る 2群の i E規 性 と い う 鎮 定 が 我 々 が 2群 を 設 定 し た 韓 関 に あ た か も 事 実 で あ る か の 如 く 錯 覚 す る こ と が 多 い。乙れに対する反伊i として、今思用いたデータの存在意義は大きいと考える。 3)複数の料男] 1手法の併用 どの判別手法を用いるかは、従来 と倣われてきた。孜々は、どの判月] 1手法がどのよ 的l うなデータに適しているかを実証するために複数の手法の併用を行っている。 今回の結果を一応、講評する ζ とにすれば、次の通りである。 . . . 奇数量化 I I懇 の 結 果 が 監 鰐 診 断 に 比 べ て 遜 色 の な い こ と と 操 作 性 (CPU時簡が少ないこと、 パラメトリック手法であるため後々利用できること、理論が懸純で理解しやすいこと、前 徽 ・ 後 処 理 の 少 な い ζ と) I と優れている点、から、数譲先日舗の科用が良七、。ただし、尤 はカテコ リ カ ル デ ー タ の 判 別 に お い て 内 部 標 本 の 誤 分 額 数 を 最 小 に す る の で 、 必 ず 併 用 す べ a きと考える。 言者も 争ベイズ診断は、吉くから慾荘、決定の手法として研究され今だに西欧の学者そ中心に f 多 ~\oζ の手法の人築の秘密は、専門家による主綴確率等をもとに、イ也の手法よりもアルゴ リズムが少し入閣の思考法に近いためと考えられる。しかし、一般的に言って軒別成織は く、特に多群半悲惨i の場合は科用できない。このため、半I J 5 3I J 或嶺を改良するために、シミュレ ーションでコド観確率を改変する ζ とが試みられているが実用的でもない。 ( 3 )2次判明鵠数は、半J I 創 成 績 は 数 量 化 I類 よ り 良 く な る が 、 推 定 バ ラ メ ー タ 数 が 多 く な る ζ ととパラメータが線形結合でない欠点がある。 4)FU N C A Tは、判別成績が良い ζ と と 交 互 作 用 等 の 導 入 が 容 易 と い う 長 所 が あ る が 、 パ ラメータ数が多いと CPU時賂が少しかかりすぎる点と結果の繋約に時障をとられる。 多 R O C曲 線 に よ る 評 錨 表 3の鵬場・ 5灰層において、医務診断と数建イヒ I類の卒I 1 混ぜ的中率は数癒化 I鎮 の 方 が 9 0 例と鮭蘇診断の 8 6O 1 J よ り も 良 い 。 し か し 、 数 量 化 互 類 の 偽 鶴 牲 は 4O 1 J であり医師診断の 1 0例 よりも良いが、偽陰性率は医師 ] ) の方が数塗化 I I類 (7例)よりも良い。このこ (5伊1 1表の 1結 果 だ け で は 特 別 成 績 の 穫 劣 比 較 が 行 な え な い こ と を 意 味 す る 。 こ れ とは 2x2分譲] をさけるため、判別基準を変えて 2x 2分刺殺を作成し R O C曲線を作成する ζ とが望まし し 、 。 、今自の研究で辻、病理診断ぞ外的基準として料問分析の結梁ぞ比較したが、一艇の … 32‑ . . . .

34.

. . . . 医学診断では病理診断のような明確な基議ではなく専問医の診断を悶いることの方が多い。 I 男 J I 結果を医騒診断と並列的に扱い、良い草I J g l J結 巣 そ 得 た ζ とは、データの 実用上からは、宇J 詰頼性が高いと結論しでもよいと考える。 文献 (1) L u s t e d, L .B . ,M e d i c a lD e c i s i o nMaking( C h a r l e sC .Thomas,I l 1i n o i s,1 9 6 8 ) . (2) Shinmura,S .,S u z u k i,T .andN a k a n i s h i,K .,D i s c r i m i n a t i o n so fstomachc a n c e r( i nJapan 哲s e ), O p e r a t i o n sR e s e a r c h26( J a n .1 9 8 1 )5 1 ‑ 6 0 . .andKudo,A .,R e c e n ta p p l i c a t i o no fq u a n t i f i c a t i o nI Ii nJ a p a n e s em e d i c a lr e s e a r c h, (3) S u z u k i,T Environm暗n t a lH e a l t hp e r s p 唱c t i v e s3 2(Oc t .1 9 7 9 )131‑141 . (4) Goodnight,J . H .e ta , . l SASU s e r ' sG u i d e(SASl n s t i t u t e,R a l e i g h t,1 9 8 3 ) . .andShinmura,S .,E r r o rr a t告 o fl i n e a rd i s c r i m i n a n tf u n c t i o n,i nd eDombal,F . T . (5) Miyake,A andGr 号my ,F .( e d s ),D e c i s i o nMakingandM e d i c a lCare(North‑Holland,Ams総 rdam,1 9 7 6 ) . .andMiya悦 ,A .,O p t i m a l l i n e a rd i s c r i m i n a n tf u n c t i o n sandt h e i ra p p l i c a t i o n, (6) Shinmura,S COMPSAC( N o v . 1 9 7 9 )1 6 7 ‑ 1 7 2 . (7)中 ~5な臼、他:コンピユ…ターによるがん の総合研究班会 料、昭和 4 9年 昭和 5 1年。 (8) 中 西 克 己 、 地 : 映 像 に よ る が ん 診 新 技 術 の 開 発 斑 会 議 資 料 、 昭 和 5 2年 昭和 5 4年。 (9) 新 村 秀 一 、 鈴 木 後 一 郎 、 中 西 克 記 : 関 X線像の各種半I J g l J分 析 、 オ ペ レ ー シ ヨ ン ズ ・ リ サ ーチ、 2 6( 1 )、 5 1/ 初 (1 9 81 ) 。 ( 10) 鈴 木 降 一 郎 、 中 西 克 己 、 新 村 秀 一 : X線 像 の 計 量 診 断 ( そ の 1, ) 第1 7鴎 日 本 M E 大会論文集。 ( 1 1)新村 表会、 、鈴木隆一郎、中国克己:各種判関 の 比 較 評 価 、 日 本 O R学 会 春 季 研 究 発 199 /200 ( 1981 ) 。 ( 1 2)新村秀一、鈴木健一郎、中西克己:乳爵 X線像のやj 別 分 析 ‑FUNCATの適問事関一、日本 O R学 会 秋 究発表会、 188 /189 ( 1981 )0 … 3 3‑

35.

SASの 陸 一周期人自 分野への応用の試み 分析を例として 大阪窮立冊子保撞総合器産嬢センター 背木浩二、江旗揚霞 三鳴博昭、河村議部 はじめに S A Sの の分析事例の紹 J Iと し て 、 人 口 動 態 統 計 を 用 い た 周 産 期 統 分野への応用の‑{7 分と、 今 回 の 分 析 後 通 じ て 判 明 し た 留 意 点 に つ い て 報 する ο 以下に、分析の日約と概要を述べる。 ・ ah 〈生後 2 8E3までの死亡 新生児死亡 〉は、寄金出 l 尽の出生時 とよって決定される。 時体重別における死亡率、 の 2つ の 因 子 i oは近 、新 の進歩によって大編に低下してきたが、舎は母親のもつ、社 など新生克 及び母親告身の生物的 よって の分布状態、争各出生 因、 つまり母殺の年令、 ・ ah t ζ i 1 罷 立など (生後 l選 未 満 ) の お お が 極 小 未 熟 見 (<1500g)、 期新生克死亡 が新生 うな問 をより正穫に、数 未熟児出 に影響を 析の経験のある 悶 会せ各出生時体重 率を下げるだけでなく〈むの 〈犠小)未熟!誌が生まれやすい、 そ の よ う な 社 会的、経済的条件の改 ζ の分析は、 的、経済的 状態、疾繍または子供の出 6 2 9 ちが未熟児 (<2500g) であることからみて、 単K.o の阪療技術を 日J Iど と に お け る 技術 は乙 ζ30年 ほ と ん ど 変 化 し て い な い 。 される。 そ し て 乙 の 分 布 状 今日の日本において、 児集中治 シカゴ大 的ζ i解 明 えていると 率を下げるのに必要であると考えられる。 るために、 問、 このよ 1980年度按人口動態統計を用いて、(骨N われる因子を拾い出し、 そ れ ら 紹 互 の 分 析 を に朝学し、 S A S 〈 パ ッ チ 方 式 〉 を 使 っ て 米 っT こ 。 の周産期人口動態分 J I 用経験はあるが、 SASICMS.SASIGRAPH平 J I 自第と共同で{すった。乙の監鶴は SAS手 用は初めてであった。 乙のため分析処理だけでなく、 CMS環 の S A S利用、アピール性の 高い GRAPH機 能 の 活 用 方 法 に つ い て も 考 察 を 加 え な が ら 試 行 し た 。 2 . 処潔概要 分析には主に、 1980年 度 級 人 口 動 態 統 計 ( ア タζ i、 4B y t eの 地 編)を鳴いた。 4 7都 道 府 県 及 び 1 0大都市の コ ー ド を 付 け CMSのミ ラ r ィ ス ク 上ζ i作読した。 乙 の 地 区 コ ー ド は 後述のマップデータのものと一致させた。 0数表を入力し、 一 旦 別 々 に S A Sデ ー タ セ ッ ト を 作 まず基本データとして人日動態統計の 1 成し、 そ の 後 分 析 に 必 要 な 数 値 ( 緩 小 未 熟 児 出 生 率 、 新 生 毘 死 亡 率 な ど 〉 そ デ ー タ セ ッ ト ど と 、 あるいは椙互に し 、 最 終 的 に lつ の デ ー タ セ ッ ト を 作 成 し た 。 従 っ て を調べたり、 グラフ化をする時には、 た だ 一 つ の デ ー タ セ ッ ト を 々の変数障の相関 照すれば良いようにしたの 守︑. v FD

36.

また、他の冨との比較などで一部のデータを加工、追加する特には、サブデータセットを錨時 作成した。 主な処療は、指関係数の計算、散布図の作成、 CHARTグ ラ フ な ど に よ る 他 簡 と の 比 較 な ど である。また、留婦分析そ用いて極小未熟見発生率と穏々の饗悶との嬰速も調べた。利用者へ AS/GRAPHによるマップ処理を行った。 のアピール性を考え、関表化の段階で S ほとんどが 沼都道府県の地思コードを持ったデ…タであるので、データの地議性を見るのに~表化すると とは非常に であった。 マップ処}閣のための日本地留めデータは独自に作成した。 l と地鼠i データの作成について 述べる。 3 . 地盤データの作 日本地区j のデータは現在 のぷいものが市販されているが、 績であるし、また今 . 後の図表化の応用も考慮して独自に SAS~MAPDATA 作成システムを開発した。 ζ の シ ス テ ム は 図 1I と訴すように、デジタイザを持つ PDPll/44とSAS/CMSぞインスト B M 4 3 4 1の 2つのコンビ A ータシステムを MTを媒体として絡んでいる。デジタイ ルしている I ザ か ら の デ ー タ 入 力 は 対 話 的 j[ 1ユ ニ ッ ト (1つの関形単位、日本地部データで言えば各都道 府県)ずつ行なわれる。入力と i 海時に、カラーグラフイツク・ディスプレイ上に、ユニットご とに色分けをしながら、入力図形が表示される。とのため、デジタイザの操作ミスなどで入力 l 湾入力できる。なお、デジタイザーを使っ 会究員女した時には、ユニット単泣ではめるが、容易 ζ たマップデータ作成システム ( P D P11144) はOSとして DSM‑llを使用しているため、データ入力 プログラムは MUMPS言語で データは、 レノ'{)レ σ 〉 永 t 1P Sのファイル構滋は木構造であり、入力 されている o Mむ 〈出 APNAME,U NITNAME,X摩擦 ~y D i s k上 l と N (シーケンシャルナンパ) )という 3 川 されている。 SAS棋 の シ ス テ ム で ζ れらのデータそマ、yプ デ ー タ と し て 読 む た め に 、 ま ず D i s k上のデー タを SASマップデータとして必要な (ID X Y) の形に編集し、 MTを 媒 体 と し て I B 説 4 3 4 1 1 と送っている。 MTからは闘機 SASデータセットを作ることができるので、 SAS似 の と使用した都道府県民会開地閣のデータを作成するのに システムの魚祖は少なし、。今阪の処理 l 要 し た 時 鰐 は 、 お お よ そ 2時間であった。 と、九州地区の拡大図を国 3I [示す。 作 成 し た 地 関 を 関 2I 組 3で明らかなように、やはり椅伎の点で少し問題が残る。 ζ れ は デ ジ タ イ ザ 鶴 の 精 度 の 問題ではなく、作業者の集中力及び入力に使用した地盤の大きさによるものである。しかし 実用上、金問比較をするためには態題とならないと思われる。 今後、入力データのユニット聞の境界線の遜なりをなくし、 を考えている ο を上げるため κ、次の二つ n n v n 4リ

37.

。 デジタイザ上に仮想空間を持たせるデジタイザの入力画面の大きさの制限をはずし、 地殴を拡大して分割入力することにより精度の向上をはかる。 2 ) データ校集時 ζ i ロジカ Jレに修正するデータ収集システムで壊界線を判部するなどのロ ジッグ考会もたせ、境界線の重複をなくし、?ツプの精度を肉上させる。 1) の 方 法 は 発 想 は 単 純 で あ る が 、 位 置 決 め が か な り 思 難 で あ る と 考 え ら れ る 。 し た が っ て 2)の方法がより実問的であろう。 4 . まとめ 以上、今回の試行結果の概絡をまとめたが、以下にいくつかの問題点、及び今後の課題を述 ベる。 ・ ah 聞は SAS ζ i 詑較的なれたニエーザ、との共同作業であったため、打合せなどの作業は 円滑に行えた。しかしながらユーザ、が SAS言 語 そ の も の に は 彊 れ て い て も CMS環 境 下 で の 使 用 は 初 め て だ っ た の で 、 ユ ー ザ が 一 人 で SASを自由に使い ζ なすようになるまでには、 若干の時照会費した。 CMSIS A Sを 使 用 す る 初 心 者 に と っ て 共 通 の 務 と考えられるのは、 1) SA Sセ ッ シ 羽 ン の 内 に い る か 外 に い る か の 即 解 2 ) CMSファイノレ上の SASプログラムを修正するための C羽 Sコ マ ン ド 類 の 修 得 3) SA Sプ ロ グ ラ ム の 簸 過 な 実 行 の さ せ 方 の 理 解 4) CMSユーザへのログオンから SASセッシヨンへ入るまで、の手続き などである。 ζ れらの解決箪として考えられるのは、 S A SICMSとユーザとの関 I . r;:さらにインターフ品 MSEXECの よ う な プ ロ グ ラ ミ ン グ 設 誌 で 作 る 、 あ ース機能を付加することである。これを C a 開 るいは懇明了績なマニュアノレそ整備していくなどの方法で実濯していく必要がある。 また DP部門鰐の課題として、 の SASを 使 い 乙 な す た め に 、 統 計 学 、 数 理 解 析 技 法 の 学 習 性があげられる。!奇知のようにせA SU s e r sGのお"には、統計 ないの議本統計量の ならば結果のま理解も容易であるが、 昧のくわしい は な統計解析処理をした時弘 結果は釘かtl:lているが数学的、統計的意味ぞとらえきれないという乙とがままある。 今後続内で底鵠などによるニE ン ド ユ ー ザ 利 用 後 推 進 す る に あ た っ て は 、 統 計 ・ 数 理 的 解 析 と熟知し、指導・コンサ Iレテ…シ 3 ンを行える体制をつくることが不可欠と考えられる。 法i 後の課題としてはまず、人口動懇統計を用いた分析ぞさらに時間軸を加えて、年次誰移 の傾向与を見ていく ζ とがある。 また、独自のマップデータ作成が比較的容拐に作成できる ζ とが料萌した。今後たとえば 人 体 マ ッ プ む よ う な も の を 作 成 し 、 各 種 亘 療 デ … タ の 解 析 と 表 不 な ど へ の SASの 応 用 も 考 えている。 一京一

38.

x x ..輔蜘・ ωい 的 ﹀ 的 ト コ 込 ZH J1↑ ︽ 凸 ふ ︽ 拡 ω叫 ω 定 戸 ωL コ mFhL は凶 N Hト H O M {︺ 内 dLJeνf¥ :げば NlhvR i iV9(Nihjx叫︹‑ ×﹀ 一 h│ 一h ωgMWCQMW乞 e: へ 22uv ︻ご芸﹀ 38‑ ﹀︿ Jn民的日(] 岨 ﹀仏O U ぽOJCU +J+ふ パ)円工仏4to 'r 'r 酬 . M Mト 詑 日 記 仏 口町︽芯 一寸何寸玄∞日 嗣 噂 傭 嚇 >,>, 庸 . 暢 相 補 ..‑N … ・・ a d明 除

39.

. . 巴 ・ a FIGURE 3 . 門APOF KYUSYU 内刈υ つ リ

40.

. . ー f d嶋 岡 除 FIGU更 正 2 . 院A PO F JA手AN 4 0…

41.

SASの実行効率化の試み FACOM OSN/F4 PFD‑SAS フ ル ス ク リ ー ン インタフぶースの作成 ニ井情報開発株式会社総合研究所 佐野猿之 1 . はじめに 現在、 T S S端 末 を 利 用 し て SASジ 活 ブ を 実 行 す る に は 、 次 の よ う な 形 態 が あ る 。 1) SA S ジ 3 ブを実汚する JC Lを登録し、それをノイツチジョブとして、起動 (SUBMIT) 会せる。(パックグラウンドジョブ〉 2) T S S配下 iζSASを呼び出し、端末より 1ラ イ ン ず つ コ マ ン ド を 投 入 し て 実 行 す る 。 ま た は 、 あ ら か じ め 投 入 済 、 あ る い は 、 登 録 し で あ る コ マ ン ド 群 を %INCLUDEコマン . 鋪 ドを用いて実行する。(フォアグラウンドジョブ〉 ζ の内、 1) の パ ッ ク グ ラ ウ ン ド ジ ョ ブ は 、 開 発 済 の 定 形 ジ ョ ブ 、 大 規 模 で 実 行 時 間 の きいジ 3 ブの実行に適しており、 2) の フ ォ ア グ ラ ウ ン ド ジ 3 ブ は 、 プ ロ グ ラ ム デ バ ッ グ や 小規模ジョブの実行に向いている。 当研究開の場合、 SASを 研 究 ・ 開 発 の ツ ー ル と し て 使 用 し て お り ワ ン シ ョ ッ ト の 型の小規模ジョブの比率 く、また、用いているコンビ旦ータ本体と研究所が離れて 地しているということから、 SASを TSSフ ォ ア グ ラ ウ ン ド で 実 行 さ せ る ケ ー ス が 非 に多くなっている。 ブオアグラウンドジ翠ブの実行は、 T S Sの その利用形態からみて . . のセッションの中で何震も行なうことが、 であり、その際、実行に係わる種々のパラメータやアウトプット 1ラ イ ン ず つ 間 違 い な く 投 入 し て い く こ と が の出力形態の選択に係わるパラメータを 孝 J I問者ーに強いられることになる。 ζ の煩璃な操作を、メインフレーマ…提供のプルスクリーン入出力ソフトウ A アを科用して 軽減することを試み、成果を母たので報告する。 2 . P FD FACO訟 の 提 供 し て い る P F Dは 、 T S S斑下で働くブノレスクリーン椴プログラムブロダ ク ト で 、 次 の 機 能 e 特徴をちつ。 1) P F Dを用いる ζ とにより次の操作が行なえる。 C む デ ー タ セ ッ ト の ブ ル ス ク リ ー ン 表 示 (BROWSE)、 編 集 (EDIT) 争 デ ー タ セ ッ ト の 移 動 、 後 写 、 登 録 、 持J I 除、ディレクトリ表示 会フォアグラウンドジ翠ブの実行 事パックグラウンドジョブの起動 ⑮ T S Sコ マ ン ド の 実 行 …4 1…

42.

告 VTOC情 報 の 表 不 乙の内舎は、 T S Sコマンド、 TSSコマンドプロシジャへのパラメータ引渡し、⑤は、 カタログプロシジャへのパラメータ引渡しの後の実行させる方式となっている。 2) P FDへのパラメータの入力は、全て、フ Jレ ス ク リ ー ン 型 の メ ニ ュ ー を 過 し て 行 な わ れ る。メニューは、 構造をとっており、項目内容に従い、腰次詳細な内容を指示する ためのメニュ…が表われる。 3) メ ニ ュ ー へ 投 入 し た パ ラ メ … タ に つ い て は 鱗 惨 な 構 文 チ ェ ッ ク が 行 な わ れ る 。 ま た 、 1 つ の メ ニ ュ ー へ 投 入 し た パ ラ メ ー タ に つ い て は 、 属 性 殻 線 部 に 手J I用 者 毎 ζ i 記憶され、同 じメニューを、再度喜子び出すと、入力部に前回投入したパラメータが表示される。この ため、前回の持び出しと変更する部分を入力するだ、けで用が足りる。 I開 設 が 新 た に 、 メ ニ 品 一 定 義 部 及 び 、 コ マ 以上の内、 1) の @ 舎 で 述 べ た 機 能 に つ い て は 、 手J ンドプロシジャ、カタログプロシジャへのパラメータ引渡しそ する部分を新たに作成 ' し、追加する ζ と が 可 能 と な っ て い る ο (尚、 FACOMの TSS, PFDは I B 却 の TSO、 SPFI ζ 対応し、その内容は、績かな点、を捺いては ほとんど同等である。誕って、額五の移績は容易である。) 3 . P F D~ SA Sインタフェース P F D SASインタブエースは、 2 .で 述 べ た P F Dの機能そ利用し、 SASの T S Sフ な種々のパラメ…タを、フルスクリーン画面に投入し、これを PFD オアグラウンド実行に 介して、 S A Sを走塁動させるコマンド プ ロ シ ジ ャ に 出 会 渡 し SASを させるためのツ と示す。インタフェースの呉体的な内容〈実 ル で あ る 。 そ の 情 報 必 流 れ の 犠 式 国 会 関 ‑ 1I 体)は、 3つ の 税 分 デ ー タ セ ッ ト ・ メ ン バ ー で あ り 、 メ ニ ユ 部と、コマンド プロシ 及 び 、 パ ラ メ ー タ に 従 い SASを 起 動 さ せ る コ マ ン ド ブ ジヤへのパラメータ引渡し TSS 端末より、 PFD~SAS インタフエースを利用して SAS ジ H ブを実行するには 次の手頼を踏めば長い。 1) TSS~ ツシヨンを開始する。 (LOGON) 2) Pドひを呼び出す。 3)必繋があれば、 SASプ ロ グ ラ ム の 新 規 愛 録 或 い は 、 修 正 を 行 な う 。 (PF Dの 能を用いる。〉 4) フ ォ ア グ ラ ウ ン ド SAS 、 a ロシジャから成っている。 の た め の メ ニ A ーを呼び出す。 (ζ の メ ニ ュ ー を E 喜一 2I ζ 示す。) L 内 a叫

43.

Interface F D P ‑ command procedure S 図‑1 S A SAS‑PFD インタフエースに係わる↑静匝フロー模市型 ーーーーーーーーーーーーーーーーーーー‑‑‑ FOREGROUND SAS EXECUTION ‑畑町‑‑‑ーーー軍司再開問帯情冊冊脚‑‑‑句 SPECIFV SAS SOURCE DATASET TO BE EXECUTED: a 除 ・ ACCOUNT PROJECT TVPE ME向 BE需 VOL SER PASSWORD ===> 双==> ===> ① = = : : お 〉 畠s 山 > @ 畠山忽〉③ IF NOT IN CATALOG ) lF PASSWORD PROTECTED ) EXECUTION OPTION: &===> NOCENTER, NODATE, CLISI@ OPTION 内 弓ζ hu ﹀ o Hu f 酎悶輔打 nwHrz EE'i 4 守 FEW JU 国一 2 フ ォ ア グ ラ ウ ン ド S AS実行のためのメニュー ‑43‑ ︐ ︑nuu?Emu 今 ︑︑晶︑ ︐ ︑ ︐ A M n Tep n w H JM ﹄ ︑ 伸︑ 供 nk HMm nunu umpEFE 'E'adnn E 守 e E 守 e 学 e p L P i v E u同 炉 ﹄ FE nu?erLTL P U M m Z ZL ︐︐︑︐ Z4 向 YAT‑‑A 守 1 守1 paea F 円 ad‑ah bpapa ?e?ERUU持 制 問 nunu "‑弔 v a同 学1fLnvnr M同 nunu 岱 D'&TA AH 'LZ‑ez $ ) SVSOUT CLASS 匙===> A( 匙===> @ PRINTE再 ID C C C︿ { OUTPUT OPTION: &===> J ⑥ OPTION

44.

今一宅金鍔 y 。 ら)メニューに必要なパラメータを投入し メニューへのパラメータ入力は次の嬰傾で行なう。(関‑2 の開に員) 1して解説する。〉 ③実行すべき SASプログラムの格納されたデ…タセット名を舎に入力する。 (11国データセットの場合、続日 MBER部は空自)それがカタログされていないときには O ! ζ ボリューム名を入れる。またパスワードをもっているときには、舎にノ fスワード を入れる。(エコーパックは無い〉 (DEMOPROG),が 凶 ‑2の場合、データセット M KI . SAS. CNTL されているの 舎実行時のシステム・オプシヨンを舎に指定する。(ラインサイズ、ページサイズ は、上主力形態 i とより適当にデフォルト値が定まっている。) 出力 そ舎に指定する。. .或いは.T'を 指 定 す る と 実 行 i 土、事j !f f l考 の 端 末 に 表 示 さ れ る 。 特 !C' . を 指 定 し た 時 は 、 事 の コ マ ン ド の 実 行 終 了 後 、 コ マ ン ド を 継 続 し て 結 末 よ り 、 イ ン タ ラ ク テ イ ブ に 投 入 す る ζ とができる o • T'の 場 合 は 、 最 初 の メ ニ ュ ー 画 面 へ 戻 る 。 .J.の場合は舎に指示する SYSOUTクラスに出力される ・ a ・ ・ 0 ・L'の場合は、 DSPRINTが起動され、舎で/1'するローカルプリンタに出力され る 。 .R'の場合は、 R JEタ ー ミ ナ ル の プ ザ ン タ に 結 果 が 出 力 さ れ る 。 い ず れ の 場 合も、ログは、議末画面に表示される。(システム・オプシヨンの指定で変更可能〉 プ ロ グ ラ ム の 内 容 を 変 化 さ せ な が ら 、 実 行 会 反 識 し た い と き に は 3) ‑ 5)の操作を繰り 返せばよい。 4 . PFD ‑SA Sインタフェースの効果 PFD-SAS インタフ五…スは~研究所内で使用を開始して斡半年になるが、その関 i と次のような局繭で:=t:K悶いられ、 効 薬 の 改 善ζ l寄与している。 1) デ バ ッ グ 2) 小 規 模 ジ 沼 ブ の ワ ン シ 設 ツ ト 川崎 3) パ ラ メ ー タ そ 変 化 さ せ な が ら の 試 行 錯 誤 ζ れらの場合、 P F D SASイ ン タ フ エ ー ス を 用 い な い 場 合 に 比 べ 、 パ ラ メ … タ 投 入 一 品 i こ獲する時間は、半分以下に減少する。 また、使用法を習得する ζ とが極めてき易でおるため、初心者への がほとんど らず、入力ミスも狸しにくい。 画、便利であるが放に、本来ノイツチジ 5 ブ と し て 投 入 す べ 念 よ う な 、 大 規 諜 な ジ ョ ブ そフォアグラウンドで無理に実行しようとする利用者が上告でくるが、 センタールーチン及び、 T S S科 用 者 登 録 属 性 の * 1 )販 に よ っ て 厳宮、な評価は行なっていないが、 ζ のようなケースは する ζ とができる。 5‑ 6人 限 度 の 人 間 が 時 持 に T S Sフォアグラウンド で SASジョブを実行しても、著しくタ…ンアラウンドが遅れるという事態は発生しない。 (FACOMM160の場合) ‑44‑

45.

5 . 今後の展望 今回の発表では、 PFDを、 SASの T S Sフ ォ ア グ ラ ウ ン ド 実 行 の パ ラ メ ー タ 入 力 の 簡 素 化ζ l 応用したツールを示したが、 PFDの フ ル ス ク リ ー ン 機 能 を SAS のインタラクテイブ実行環境 の改善に利用する方案は、地にいくつも考えられる。 伊jえば、 SASの い く つ か の PROCは 、 入 力 構 文 が 複 雑 で あ り 、 使 用 の 度 に マ ニ ュ ア Jレを参 照しながら、パラメータを投入しなければならない。このような場合パラメータの説明を含 んだメニューを用意しておけば、入力が大変容易になり、機能をある程度限定すれば、マ イコン・ソフトに最近見られるような簡単言語のような集い方ができる。 現在、当研究所では S A Sの イ ン タ ラ ク テ ィ ブ 利 用 の 状 況 を み て 、 定 形 的 な 処 理 を 抽 出 で き れ ば 、 コ マ ン ド フ ロシジャとして、まとめて、 c ‑ . PFDと の イ ン タ ー フ ェ ー ス を 、 作 成 し て ユ ザーに提供することを考えている。(し、くつかは罵発を終り試用している、 このようなツールについて、成果がまとまれば、機会を改めて報告したい。 . . A性 にd

46.

SASを 使 っ た IMSオ ン ラ イ ン 資 料 作 成 シ ス テ ム 第…生命保韓梧互会社 システム管理諜 宮武嶺夫 当社では、昭和 9月 よ り 、 第 二 次 総 合 オ ン ラ イ ン シ ス テ ム ( iBESTシステム J)が稼動 AS 会開絵した。乙の新システムの内、大きな効築後あげている「汎用資料作成システム J I ζは 、S が 使 鳴 さ れ て い る 。 以 下 ζ れについてのべてみたい。 資料作成システム開発の 当社では、時和 5 3年 迄 iζfコスモス・システム j と 称 す る 、 全 閣 の 支 社 ・ 営 業 部 に お け る 保 備 h 険業務のオンライン化ぞほぼ終えていた。さらに、一層の事務合瑚化を目差し、昭和5 4年 4月 ζ i、 f 事務システム開発プロジェクト j が 発 足 し 、 本 社 ・ 支 社 6 8・ わたる事務所の業 ζ の結果、全留で約 151 ・支部 1700に の把揮を行なった。 600絡の堂業管理用資料が手作成されており、 ζ れは、約 150人 相 当 分 の 業 務 欝 に な る 事 が わ か っ た 。 よ く 、 保 険 会 社 は 「 人 と 緩 か ら 出 来 て い る j と議われるが、 その乙と…端が証明された訳である。 又、饗料後分析すると、職場独自の絞験から作成されたものが多く、様式の統 が晃られ ない事、同一内容の饗料が複数の場所で作成おれている事がわかった。 この結果から、次期システム題発の目玉の a つとして資料作成の機械化が置かれる事となっ ? こ 。 . 務の標準化を促進し、単純な手作業をシステム化する。資料作りに追われる事務から、考 える の移行である o ~Il の見方をすれば f コスモス・システム J で総合システム体系化さ れ、議綴された大量のデータを利用し、多様の業務処理後行なう段暗に入ったと設える。 I I 汎用ソフトウェアの導入 乙うして流舟資料作成システムの開発 総された。 ζ のシステムの概要は次の通りである。 DB/DCの 基 本 ソ フ ト ウ 且 ア と し て は Jコスモス・システム j の 時 に 、 そ の 拡 張 性 ・ 多 様 性 ぞ考慮し、選定し導入した 1 MSを継承する。全闘の台帳惑を本社センターコンビュータ内に データ・ベースとして讃く。 、支社・営業部には、 1MS I B M / 8 1 0 0をインテリジ品ンいターミナル 1 0 0端 末 を 使 っ て 全 国 か ら 各 種 の 資 料 作 成 袋 求 が 送 ら れ て く る 。 セ ン タ ー 側 として投鰻。乙の 8 MSデ…タベースを読んでそれぞれの器料を作成し、会詩的端末へ出力する。 では I 資料作成に必要な機能の分析を行なった所、次のものがあげられた。 ヴ4 4・

47.

1 . 必接とするデータ構報項自の抽出機 2 . 四則演算機能 3 . 条件検索機能 4 . 配列並び換え機能 5 . 1 1 彊盈付け機能 6 . 各蓮集計機能 7 . E!J樹編集機能 ζ れ ら の 機 能 を 全 て 自 社 関 発 す る と 、 全 部 で 約 30万 ス テ ッ プ も の プ ロ グ ラ ム が 必 要 で あ る と予想された。そ ζ で資料作成部分を汎伺ソフトウェアにまかせる事にした。 汎用ソフトウェア選びが始まった。議本機能が充実している事に加え、システム環境の変化 に柔軟に対処できる率、そして荷よりもシステム部外者でも覚えやすく、使いやすい事を念頭 . 咽 に置いた。 d い く つ も の 汎 用 ソ フ ト ウ z アをテストし検誌を重ねた r S A SJに 決 定 し た 。 機 能 の 豊 富 さと、コーダイングの容易さ、そして特に大量のデータを自由 P : .扱 え る 事 が 魅 力 だ っ た 。 こ の 時、センタ…側でかかえるデータ量がかなり大きなものになるという検討結果が出されていた のである。 昭利 5 6年 4月 か ら 本 格 的 な 爵 発 の 始 ま っ た 、 汎 用 資 料 作 成 シ ス テ ム に 愛 称 を 募 集 し た 。 数 多 い名前の中から rSTAFFJ1 乙決定した。 I I I I説 Sオ ン ラ イ ン で の S A S M S下で稼動させ、さらにそのえデータとして、 I M Sデータ・ベースを使関する事が S A Sを I 大の技術的な問題となった。 まず、支社・営業部の端末から滋られてきた S A Sス テ ー ト メ ン ト を オ ン ラ イ ン ・ メ イ ン プ ロ グラムが受け取る。メインプログラムは、 データ・ベース 1 0プログラム考会使い、 S A Sステートメントにより、使用するデータを解析。 I M Sデータ・ベースより必要なデータ f どけぞ抽出し、 ζ れ を OSデータセットに移し変える。又、 S A Sステートメントも、 S Y S I Nとして別の OSデータセットにた め込んでおく ο ζ れで、資料作成の準備完了である。 次に は 、 r S A S J ぞ呼び出して、 S A Sステートメントとデータぞ渡し、議制作成を行なう。作成結果 OSデータセットに入れておく。 r S A S J が受持つ資料作成ステッブは終了である。 コントロールは、再びオンライン・メインプログラム 1 < :移 り 、 後 は 作 成 さ れ た 資 料 を 支 社 ・ 部に設議したプリンターへ出力してやれば銭い訳である。 また ζ の シ ス テ ム の 利 用 者 が コ ン ピ ュ ー タ 経 験 め な い 一 般 職 員 、 特 に 女 子 職 員 の 筏 用 が 多 い と思われる事から入力にはパラメータ一方式ぞ採用した。 ζ れ は 、 支 社 ・ 営 業 部 か ら 入 力 そ 、 S A Sス テ ー ト メ ン ト を よ り 単 純 化 し た パ ラ メ … タ ー に す る も の で あ る 。 送 ら れ て 来 た パ ラ ‑48‑ '司恥

48.

メ…ターは、センターコンビ A Sステートメントに変換されて実行する。 タ一向で S さらに ζ のパラメーター悶体もデータ・ベースに受錦できる犠にした。 パラメ…ターを叡り出し、そのままオンライン下で実 資料番号を ぞキーとして る。乙れにより、支社・ 部では から入力するだけで、時じ蜜料を何回も取出せる様になる。 I V SASむ 効 力 と 今 後 の 動 向 了した。崩発プログラムは約 1 7万 ス テ ッ プ 約 1年 半 の 期 間 で 汎 用 資 料 作 成 シ ス テ ム は ほ で、資料作成部分を f S A S J わりさせた 期間で揮発できた要閣である 、障達し、ない。 昭和ら7 年 9月 1 5日 fBESTシステム Jはカット・オーバーした。 現夜 r STAFFJでは一日 850件の綴票作戒を行なっており、一件当たりの所 いう謝 a は2 7 . 5秒と が出ている。 また、初めからセンター側で帳票プログラムを組んでおき、それを実行するだけのレディー メイド・タイプのものと、支持:・営業部で S A Sパ ラ メ ー タ ー を 組 立 て る オ ー ダ ー メ イ ド ・ タ イ プのニ方式を導入した所、次の結果を得た。 盗料作成数の推移 5 7年 1 0J j ・ ah メード 1 2月 生 759件 4 ,681件 12 .211牛 ' I 2O .966件 レディーメード ; t ダ 昨年 カットオーバーしたての 1 0月と 2ヶ月後の 1 2月そ比べてみただけでも、オ…ダーメイド・タイ ブの資料作成件数が亙観的な伸び考会毘せている。この傾向は続き、さらに 業部のアイ デアを生かした新しい資料類が作られてゆくものと思われる。 さらに今後は、販売支援的要素の強い構報、経営全般に有勢な全ての情報に対する諮獲が場え てゆくものと慾われる。 資料そのもの 形式としてただの になるであろう。 伊jえばグラフ出力。 出力だけのものから筏覚的な説得力のあるものが ζ れには る。又、漢字出力も必須の条件になるだろう。 r S A Sグラフ j が 活 用 さ れ る も の と 思 わ れ r S A S Jの 漢 字 対 応 機 能 が 務 綴 さ れ る 事 を 窮 待 したし、。 さらには、経営指標の策定や、将来予織といった機能の要求もあるだろう。(.この熊婚では r S A S Jの 中 に あ る 計 量 経 済 、 時 系 列 これからも の機能を活用してゆく事になると思われる。 r S A S J には充分に働いてもらわねばならないようだ。 ‑49‑

49.

構報データなどの文字列処理への SASの 一 利 用 例 北書道大学 工学部 上 島 壮 1 . はじめに S A Sは 2 0 0文 字 ま で の 文 字 列 変 数 を 定 義 で き 、 S U B S T R、L E N G T H、R E V E R $丘、 P U T等 の 関 数 を 持 つ な ど 、 充 実 し た 文 字 列 処 理 列 カ を 持 っ て い る 。 そ 乙 で は、文献 の 計 算 機 入 力 デ ー タ の 整 理 に S A Sを 務 局 す る こ と と し 、 現 在 そ の 作 業 後 続 け て い る 。 ζζ で は 、 文 字 列 デ ー タ 整 理 の 種 々 の 作 業 へ の S A Sの適用とそれらの手法の:二、えの応用f91 J について報告する。 岨.. 2, 使 用 デ … タ に つ い て ASPHAlT prwいξ民Tlε5 ANU COMPOSITION: 1950 1960; DAVln A. ANDERSON;ξRVIN l. DUKATZ; : AADT斗9' PP01 ・ 2寺 τH在 対 ARDξtllNG OF 斜 IDDLξEAST PETROLEUM ASPHAしTS IN PAV正 予1 芝NT 5υRFAζHIGS; 主. J . DlζKIN50N; A υ 。 633 AAPl与守, PP. 言 81 PIN130A災 主 T R対ξOLOGY: ξXPξ 尺P.¥ENTAL OETE民MINATI0N OF DYNA例 i ζ ASP純真 L MODυII A τ LU凶 T 芝川 PERATUf~F ; AU HARRY S. PINK; RICHARD E. MERZ; OAVIO S. sOSNIAζKi AAPT49' PP. 64 嶋 守 4; f ¥1 GAN80RζA 終ECYCLIf ' I G CONV主NTIONAl AND RUsAERIZとo BITUMINOUS CONζRETE P A I J乞i 1芝NτS U51NG RE(YClING AGENTS AND VIRGIN ASPHAlT AS MonlFIERS (A しABORATORY ANO FIElD STUDY); AU CHARlES R. GANNOH; R08ERT H. 叫O刈BlES; CHArlξ5 A. RM1EYi JJ ¥ 問 主 S P. OAvIS; WILLIAM V. LITTlEi AAPT4守, PP. 95 ‑ 122; BI BOD80Aτw ASPHALTENES, 凶 HERE ARE YOU 1; A υ M. M. BODUSZYt . lSKI; J . f. i " i CKAY; D. 民. lATHAM; をPP80Gf只 GUIDEllNES fOR RE仁YClING ASPHAlT PAVEHξ 対TS; AU J. A. EPPSi R. l. TERREU [ ) . N. L lτfl芝i I 毛. J . HOl院GRξHH AAPT斗9' PP. 144 ‑ 176; Bl ANOBOAPA AU 81 DIC80TH 網 。 棒 , . . . 図 ‑1 使用データ鈎 1(ま、舗装用アスフアルトおよびアスフアルト舗装に関して な文献である A A P T (P r o c e e d i n g s:A s s o c i a t i o no fA s p h a l tPav i n gT e c h n o l o g i s t s )の 、ボリュームおよびぺ ジを一組とする計算機入力データの一部でiI>る。 ζ の デ ー タ に は 1 9 3 3年 か ら 1 9 8 0年ま での AAPT の 848 論文の書誌培報が集録されているのデータの形式は、げの~識に論文 1 D (識別コード)、 A Uお よ び B 1の フ ィ ー ル ド 1Dが 記 入 さ れ て お り 、 白 唱 と あ け て そ の 右 艇 が 内容の記述欄であり、乙こは自白書式でセミコロンが挺切り 3, である。 切り出しの方法 S A Sによる劇詩の七万り出しの方法としては、 1行 1オブザベーシ沼ンとして、 i) 1カラム に 1パ イ ト の 文 字 型 変 数 〈 通 常 ) 合 計 80飼をおjり 当 て 、 区 切 り 日 号 間 の 変 数 績 を 連 結 す る 。 … 5 1‑ …

50.

i i ) 1行を 80バ イ ト の 1変 数 に 割 り 当 て 、 変 数 内 の 1字 1字 を 調 べ 区 切 り 記 号 聞 の 文 字 列 を SUBSTR関 数 で 切 り 出 す 、 二 つ の 方 法 が 考 え ら れ る 。 筆 者 の 切 り 出 し プ ロ グ ラ ム の 基 本 形 は 図 ‑2に示すものである。 DATA; INPUT LINE 干仁川 ^RBO. 砧1 (51闇討 80) (¥ CHAI~1.); AR只AY 5(1) S1‑SeO; 1ST八RT=1; RET, 1 ¥ H ! 門AX 斗o; DU L=1 to MAX; DO 1=ISTART TO 80; IF S NE.・・ TH[N ( j 1 J TU ̲̲11; ー 13; ENO; GO TU ̲ ̲̲11: lT口P=1; 口 。 1=1TUρ+1 r o 80; IF 5 = ' ,THEN GO Tリーー 12; 1=81; ¥ . JLEN=I‑IrUp; LENGTH Wり内 D 事40; U~ Ll; ー ー 12: I, ~DR り =SU 日 5TR(LINE , ITUP , WLEN); ‑ OUTPLJ1; KEcP I J .OR口 ; ISTART = 1+1; END; ̲̲13: RヒTURN; 仁ARDS; 図 ‑2 単 語 切 り 出 し プ ロ グ ラ ム の 基 本 形 乙の例のように空白のみを区切り記号とする場合には、全く簡単なプログラムでよいことが示 されている、 (SA S例 題 デ ー タ セ ッ ト の メ ン バ ‑WORDFREQ参 照 ) 乙 の デ ー タ で は セ ミ コ ロ ン 、 コ ン マ 、 括 弧 な ど の 特 殊 記 号 を 区 切 り 記 号 と す る た め に 図 ‑ 2プ ロ グ ラ ム に 手 を 加 え て 用 い ている。 乙の切り出し作業 l とより、単語は 1語 1オ ブ ザ ベ ー シ ヨ ン 、 著 者 名 は 1名 1オ ブ ザ ベ ー シ ヨ ン として SASデータセットに出力する。 KEEPされた変数は、 1D :論文 ID. SEQ:論文 順 序 番 号 (1Dの補助変数) . TYPE:タイトル・ AU.B 1の区別. W O RD :一個の単語・ 1 名 の 著 者 名 ・ ボ リ ュ ー ム , ペ ー ジ デ ー タ . O R D E R :WORDデータの 1件における順序番号、 などである。 T、if: ぺV ‑ 戸 ‑ ‑ ‑ ‑ ‑ F ‑52 a

51.

4 . 切り出されたデ、 4‑ 1 タイトルの タの統計的性格 について FREQυ 正NCY BAR CHART FREQ WORD OF ? 村 正 ‑ ASP ALT AND IN A BITU時 INOUS FOR 村IXTURES ON CONCR主T ξ PAVE例 主N τ PAV王 将 E .NTS TO ASPHALTIC TEST PAVING DESIGN PROP. ERτIES ASPHALTS WIτH 佼OAD CONTROL sτυDY P正RFORHANCξ 狗ATERIALS 正VALUATION BY MEτHOD AN i き t *輯鈍揖時耗持誕奨耗耗 I H H I蝿 803 i 輯提 1 1 1 1輯話器 3岳8 i 輯鈍揖提耗 272 1輯揖提轟轟 2奇9 204 PHt軽量 l 輔器禁 153 152 132 114 111 106 争3 88 87 74 73 66 !韓耗誕 i義語義 誕挺 i i 提持 !説" 1*持 l 誕持 l 韓長 l 誕 l 誕 f 奨 持 i 6~も l 持 l 蝿 62 60 52 46 45 44 44 42 42 42 36 36 1 1 l 提 l 誕 !袈 i 発 提 i 謀 i 持 i l 輔 耗 1 臨‑3 単 ・ 803 1171 1443 1683 1887 20奇0 2192 2324 2438 2549 2655 2748 2836 2923 2997 3070 3136 3200 3262 3322 3374 3420 3奇65 )50 9 3553 3595 3637 3679 3715 3751 10.33 4.73 3.50 3.0守 2.62 1.守7 1 .守6 1.70 1.47 1.43 1.36 1.20 1.13 1012 0.95 0.94 0.85 0.82 0.80 0.17 0.67 0.59 0.58 0.51 0.57 0.54 0.54 0.54 0.46 0.46 10.33 15.06 18.56 21.岳5 24.28 26.24 28.20 2事.90 31.36 32.79 34.16 35.35 36.49 37.60 38.56 39.50 40.34 41.17 41.97 42.7奇 43.奇1 44.00 ヰ今 . 58 45.14 45.71 46.25 46.79 47.33 47.79 48.26 の出現頻度上位 30語 E 喜一 3は , タ イ ト ル i と使掃された単語の出 a cυM. PERCξNT CUM. FREQ PERCまNT ASPHALT、 BITUMINOUS、 ASPHALTIC の 3 頻度に 30 ~ したものである。その内、 は同意語で、 MIXTURES、 CONCRET目 、 PAVE M! 取すなどと複合語として用いられることが多い。 一 … 53‑

52.

FREQUE対CY BA内 CHART WORD FREQ cυM. PERCENT ζUM. FREQ PER仁王 NT THE A A5PHAし? AN 正VALUATION しABORATORY 正FF. ECT PROGRES5 PAV正純正 rH UESIGN lCATION APPL BITUMINOυs 50列記 FACTOHS 。 正 V記LOP川ENT 同 区 PO終? ωUALITY INTRODυCTION FLEXlBL主 ミRELATION COf COMPA日150N 仁OMPACTION 鴎 1蝿耗韓耗 1 1揖蝿輯輔輯蕎糞蝿糞蝿蝿叫輯輔轟轟轟轟 117 l輯挺轟轟轟轟輯輔叫持輯普警器提話器提輔輔 守8 l揖輔輯醤 21 i揖蝉輔輔 19 I~ 封 lt 14 i揖詩 10 i話耗 10 q 韓詫 i q l 輯髭 q q │雑話 i叫蝿 l提持 In I I I i誕 In Hf t II 1 1 1 i提 i誕 1 装 4 間一 4は , タイトノレの第 a 7 7 7 6 6 6 色 b 岳 6 タイト fレ ζ i用いられる みの頻霞の 117 215 23岳 25う 26事 279 269 2守8 307 316 325 333 340 347 354 主 告 。 3む6 372 378 384 390 3守6 13.81 11.57 2.46 2.24 1.65 1.18 1.18 1.06 1.06 1.0る 1.06 O.守4 0.83 0.63 0.83 0.71 0.71 0.71 0.71 0.71 0.71 0.71 13.81 25.38 27.66 30.11 31.76 32.94 5今.12 35.18 3毛.25 37.31 38. 37 39.32 40.14 40.97 41.79 奇 2.50 43.21 43.守2 44.岳3 34 45. 46.04 46.75 ‑ 請の上段 2 2 2 2語 を 抽 出 し た も の で 、 プ ロ グ ラ ム で は 悶 3作 成 用 SASデータ‑e:ツトに対して、 1F O R D E Rニ 1; と 選 択 ス テ ー ト メ ン ト を 入 れ る ζ とにより得られる。 川崎 一紘一

53.

FREQUENζY BAR CHART まN Wし z 3 今 単 苦 限 口 五 ・ a をB f Hき I~を ~UBHBf 鈴災事HBHHHBBB号訴災対 ~BBHBHt 奨 i録 iHHHt 長 if 告を ~HHHHBHBHH~ In鈍**様 U炎J H t , 5 ~Ht 従事B~ きま誕*挺 HBHBBf誕J B B f も 7 8 の 9 10 1 1 さ 1 2 13 1今 15 16 17 18 19 20 21 災後炎*炎 i H H t誕採録 JBHBBtUJBt JBをきfnu** 録 ~BBを JHHHt 後焚繁栄 *UJBBtn*奨きを JUHtU ま 4 鈴 まH HBBt き まu耗uun JHBHBfき を まS iHHUt J B t u * FREQ CUM. PERζENT CUM. FREQ ERCENT P. 158 1358 912 461 434 478 962 931 652 666 350 179 77 60 52 17 11 158 1516 2今28 2889 3323 3801 4763 5694 63今6 7014 7364 7543 7620 7660 7732 7749 7760 7764 7766 7770 7773 今 2 4 3 2.03 17.47 11.73 う. 93 5.58 6015 12.38 11.98 8.39 8.59 今. 50 2.30 0.99 0.77 0.67 0.22 0.14 0.05 0.03 0.05 0.04 2.03 19.ラ0 31.24 37.17 42.75 48.90 61.28 73.25 81.64 90.24 94.74 97.04 96.03 98.60 99.今 ? 99.69 99.83 99.86 99.91 99.96 100.00 曹 司 圏 構 輔 咽 酔 輔 柵 + 輔 ー ー ー . ̲ ‑ 岬 + 咽 酬 噛 酔 咽 静 ー 咽 ・ ー ー + ・ 骨 量 400 800 1200 FREQUξNζγ 出 現 頻 度 5 出現する ・ a 図 ‑5は の長さめ頻度 .W現 す る 単 語 の 長 さ の み を 制 定 し て そ の 頻 疫 を プ ロ ッ ト し た も の で あ る 3は、 WLEN=LENGT 日( WORD); と す れ ば 、 簡 単 に 求 め る ζ とができる。 ‑55… 0 の長

54.

FREQUξtKY BAR CHART wLεN F良正 Q l 4 I l f I 1 H t l H I 18 i 延耗提訴 I HIl!l! 42 i 詩提提訴 l H !材対提訴耗詩詫誕 l !挺封 l H H ! 98 i 廷l!誕詩誕 l I lH H!持鵠詩語詩話器提封輔揖 1 f t !持! l耗提耗耗 u 144 i括提訴詩 l ! lt l HIl!持持話語資提長話終損揖揖 1 0 1 1 1耗詫 131 英語接訴詩持詩 l I lH HH!耗耗琵長*誕祭器封訴時l!耗醤 1耗詩耗耗耗括提 l 171 i 器提誕奨 u 奨詩 1 持l!時時括提語長話謀長持l!耕輔 l H H !卦耗詩語耗 l B !封器蝿持1I 188 In 器禁耗耗~~詩琵 l~ 持揖 11 封 II 持器提器禁器提説持持制提訴括提耗提訴括提 171 時I H を提謀長持奨提訴封 I H H H !話器器禁詩誕誕持持封掃討持 l 138 │ 封 1持挺 n括経詩話 l B H H I持1卦訴時誕誕 98 │ 説I ! l HIlHBI詩琵話 I 1 56 j長1持l l l H !琵I ! 39 j誕挺挺持持封 29 14 i 誕 主5 提 i 誕1 I 12 │ 録 7 4 を 1 1 2 2 2 2 5 ヰ 単 5 , Z 杢 , < 五 の 長 さ b 7 8 守 10 11 l之 13 14 15 16 17 18 19 20 21 CU何. P五 災 C芝NT CUM. FREQ PERCENT 4 22 §毎 162 306 437 608 796 967 1105 1203 125守 12守色 1327 1341 1353 1360 1364 1366 1368 1370 0.2守 1.31 3.07 7.15 10.51 9.56 12.与8 13.72 12.48 10.07 7.15 4.0争 2.85 2012 1.02 0.88 0.51 0.29 0.15 0015 0.15 0.29 1.61 4 6 7 11.82 2203奇 31.守G 鳥寺 . 38 :'8.10 70.58 80.66 87.Bl 守1 .90 94.74 守6.86 守7.88 98.76 守守 . 27 守争 . 56 守守 . 71 9守.85 100.00 a咽除 帽帽胴柵+酬噂肺輔+幽噛岨・+曲圃・・+ー・.̲+柵軸欄 4ト榊輔輔+・幽咽骨+畢咽.̲+ー‑ む 20 40 岳 80 100 120 140 160 180 .QUEN乙Y FRE 主 挙 数 題一 6 用いられる 6 ' ま長さ n 密‑ WORDで 分 類 し 、 単 0) の長さの頻度 が{可題あるかを示すもので、 SUMMARYプ ロ シ ジ ヤ … を 用 い て 変 数 WLENの平均綴を求めるというプログラムで作成した。 … 56‑ , 咽

55.

F 俺D t 疋舵T ぽX I ?部 駁X I 単 滋X I 室開 ー ・ 首叩 数 策怠 : 2 t l 日 1 鍔 a 蜘 恥 2 1 品 喜 5 7 1 0 30 ∞ 質調o LOOO 1 FAO" 1[ 1 司D I N T 出 現 回 数 鴎 ‑7 感 科吊回数l 乙関する 欝…?は,タイトノレ iζn間 出 現 し た 単 語 は 何 種 あ る か を 示 し た も の で 、 半 数 以 上 の 単 語 は しか出現していない。 一部一

56.

4‑ 2 著 について 2 r~ 王 τ 亡 ALF C.τ. 2 MEYER FRANK R. P. f~ 1 DDLξTON s.ζ. 2 f ' IILES T. K. MILLξR C. L. し ER 在. V. MIし 2 MILLER J. S. JR MITτEN W. R. J v 1IYAOKA YOJIHO ト1F. 3 MOAVをNZAD正 ' 1 1 0しZA 斜 、 A j . . ‑ ‑ MON1g ̲IJηTH CARL L. ~10NISMITH C. し ・ 3 MuNlSMITH CARしし・ ト ‑ c . . / ト 10NISMI刊 在 的 せ ず 計 叩 ち CARL L MOORE J. 災. ~10R 王 L GUY MORGAN A. DUKE t 1 0只GAN T. 主. fvl0RRIS G.11 門ORRIS G.K" τ MOR佼 15 G王NE R. MORRIS JACK MORRISON 只OGER L. MOSCHOPEDIS SPEROSξ. MOSEY JOHN R. ト 10Y王R RAlPH A. , ・ ‑ ‑ ‑ ・ 悶 ‑8 著 者 名 a鴫.. を利用した入力データの検査関 事著者名は、図← lの 入 カ デ … タ を 関 ‑8の 形 式 に 変 換 し て SASデータセットに保存される。 ζ れより辞書1 震の名簿を作成すると、複数領存在する名前のパンチミスの発見が容易となる。し かし、名前のイニシアノレ化の仕方はケースによりまちまちなので、個人を捻出するためにさらに ~-9 の形式に 司 して統計を取った。 d 19 GOETZ WH 17 MONIS問 !τH Cl 13 ~1ζLEOD NW 只 REL 只 し 11 T五 10 N在VITT HG 10 SCHt~ 五 Y 互 R HE 9 PAUし5 JT 9 TRAXLξR RN し ERGA 8A 9 VAし 9 VOKAC R 8ζAMP王N WH 8 CSANYI LH 8 KRCHMA LC 8 WELBORN JY 7 CORBετ? しW 図 ‑9 個人を るための著者名の変換椀 … 5 8…

57.

FREQU正NCV BA災 CHART 輔 FRξQ l HBl-きをさをきを JOH~ 誕誕 ~Hf 根拠採 n 焚疑終炎炎 iH寺 ~HBH~ 543 543 68.47 68.47 2 1~HBfn~Ht 110 653 13.87 s2.35 3 i 祭 主 主 48 701 6.05 88.40 表 4 I J t袋 37 736 4.67 93.06 田 う Hf 21 759 2.65 95.71 1* 1 1 770 1.39 97.10 7 9 779 1.13 98.之3 8 t 763 0.50 98.74 9 4 787 0.50 99.24 10 2 7s9 0.25 99.うO 11 1 790 0.13 99.62 13 1 791 0.13 99.75 17 l 792 0.13 99.67 793 0.13 100.00 発 。 数 ︿連名含む) ・ a FREQ CU門. PERCENT CU門. FREQ PERCENT 圃 19 ‑‑幽晶画+‑圃ーー+‑‑‑ー+・ーー・・・+輸軸‑岨+・働側 100 200 300 今0 0 500 FREQUE : .NCV ・ a 著 者 ー 数 10 著 者 の 発 表 回 数 ζ i窮 す る 集 、 乙の年報にお 留 ‑10は した が荷名か、を示すものであり、約 68%の みの発表となっている。 が 間の 日 可v pb

58.

FREQU主NCY BAR CHARτ 制 F氏EQ , ぎREQ CU何 FREQ 剛 Il!世時封 i H t語録長話器提詩 n奨u誕誕長詩語耗義語義 I H !詩3 2誕器提 I 1炎 PE尺CENT CUM. PERCENT 337 337 68.78 68.78 2 │揖時耗提器提韓 67 404 13.67 82.45 3 │持終括提 37 441 7.55 90.00 4 I I H I 21 462 4.29 守4 .29 5 。 1 1 1 q 471 1.84 96.12 Il ! 7 478 1.43 守7 .うう 7 In 6 484 1.22 守8.78 6 3 487 0.61 守守 . 3守 争 2 489 0.41 守守 . 80 1 1 l 490 号. 20 100.寺号 第 若f 国 数 ' ' 珊 骨 骨 ‑ ‑ 幽 司 令 働 網 " ・ ・ 4・‑‑・・・・+・・・・・+・・・・・+・・・・+‑‑‑耐 50 100 150 200 250 300 FR正QUENCY 著 者 a 数 冨 ‑1 1 第一著者の回数 l 乙関する集計 E喜一 11 は,第一著者となった回数のみについて集計したもので、 1F ~-10 の作成プログラムに, ORDERニ 1,という選択ステートメントを入れるととにより得られるの ふ磁器データセットの利用例 5‑ 1 ~有 の作成とデータクリーニングへの利用 扱うデータが母悶認でないため、スペリングの検査は厄介な作業である。 ζ のデータについて は 、 出 現 単 語 数 が 約 7800、用語数が約 1400で お る 。 し た が っ て 、 単 語 デ ー タ を 要 約 し て 周 としてからスペリングの検査を行うと能率的である。さらに、新しいデータについては、修 済剤詩集を照合用の辞書として用い、辞書にない単語のリストを出力する方法を取ると一!溺能 的である。 ζ れには MERGE機 能 を 利 用 す る が 、 以 上 の ー 速 の 作 業 の た め の S A Sのプ口グラム は単純で小さいものである。 ら… 2 簡 易 文 献 検 索 シ ス テ ム の 作 成 摂 大組棋なデータベースシステムが用いている転墨ファイルなどの方式でなく、金デ…タ者任問、 する形式の文献検索システムの伊IPを ~-121ζ 示す。 60‑ 川崎

59.
[beta]
READY
ALL(
J
仁 DO(I
N)υ5('M0501b.FILξ.SAS.111L!:')
民EADY
JC DO(A) 05(FILξ.CIHL(Rξτ 宍))
ALL(
I
{EADY
SAS
〈くくくく
5A5
S T A R T 主 U υATを=
:
t
l
3 U2四己主1 1I
I
'
I
!
::11:
3
々
:
じ3
G 災 APHI 乙 OSI~ C佼ξATEり
くくり SN=事SAS.OATA ))
NOTま: SAS RELξASE 79.5 AT HOKKAIDO U~IVE ペ SITY (023守7).

)))))

刷

l?%INCLUDE A;
lbtl?K'"
lb9>STATE OF
170>STATEゆ
り F1
17I>FI.
2長
正N

a・

1721PR;

ι品 ‑THE‑ARτSUωVEY OF REINFO ED ASP ALT PAVfNG

BUS70ASO

A 以品

SHEb4EζF

ELECT向 付 lιιONT匂 LS FOR ASPHALT PAVERS : T村 正 証

以

対

ι
ιょιTHE ART

1731K泌3
174)UF 持LY l
!
ξ
0
175>FI;
2 托EN
Hb7PR;
日IStlOAむH

ANALYSIS OF HIGH TEMPERATURE INSTABIしITY FAILURES QF 対ξAVILY
TRAFfIC湖 ASP惜 しγ w ξ 附 T5
‑
‑

HOL47Tξu

T村正正 FFECT OF THE NATUR在 AND PARτICLE SIZεOf GRANULAR AGGR正GAτE5
ON T村
正 P柳 田 TIE5 ぷ ASP付ALT‑ζLOSE
斗 GRA当 AGGRξGATE 川 XTURES

明

17771持

・

<<<くく
宍ξADY

SAS

E'
"υ と U

ah

関

ζ の関で、

。
柱 rI卜l七:11:3>7:
.
5
1 )))))

DATξ:!B l
i
2
ω
胆

12 簡 易 文 献 検 索 シ ス テ ム の 作 成 関

dd名 IN のデータセット ζ
i 単語(文献) S A Sデ…タセットが, dd名人のデータ

セ ッ ト に 処 理 プ ロ グ ラ ム ( マ ク ロ 名 K W . Fl
,
りである。

PR) が 格 納 さ れ て い る 。 実 行 の 手 順 は 次 の 通

i) %INCLUDE文 i
とより処理プログラムそ読み込む。 i
i
) 1 6 8 ?のメッセージは、

処 理 プ ロ グ ラ ム の 大 き さ が 1 6 7げである ζ とを窓球する。
の入力待ち状態となる。

iv) 2法 的 検 索 議 S T A T E

i
i
i
) マクロ名 K Wを入力すると検索
O Fま た は 先 頭 が S T A T E ‑ O Fで

始まる語を検索するよう指示する。 v) マクロ名 FI を入力すると. S A S の DATAス テ ッ プ が 検
デ ー タ セ ッ ト と 文 献 デ ー タ デ ー タ 々 ツ ト を 照 合 し 、 ヒ ッ ト し た 文 献 の S A Sデ … タ セ ッ ト を
作成する。

v
i
) マクロ名 PRを入力すると、選択された文献のタイトルを表示する。 v
ii)以下同様
‑61…

60.
[beta]
に
、 O F語躍が、 LY語尾が、 E Dの1
1
慣に並ぶ語群を検索する。

6
. 文字列処獲の応用例

1 カタカナ語の辞書編整列プログラム
6

.
︐
.
︐
A

動

.
.
︐.︐
.︐.︐︐
nMnunHM門υnM
M問創刊M問削同制内
定
ELEF
・‑︐.︐.︐.︐.︐

仰向

鍋

.
.
︐
F
M

定J

HHH働
‑un
一甲山町
.
.
︐
u‑nu‑nu"

Z2222

暢

訪問働un
n
M
n
M

.︐

‑
‑
h
‑
‑
‑

︽

刷倫笠

︽

山

Faw

︽

舗網

司

き 'nu‑‑nu‑‑HU‑‑nu''HU
TJT‑
令
'
つ TZTXT
享
︐.︐奪事︐.
==nugnug
M
円
HUm‑znuHU
怠
OOGGGGGGGoo‑b?
"門2MH3M 叶 gMH3 阿川 2
a‑nu
unHRFHRfnH内JN 工 民 民 オ G
nunu'nu'nu'nu'nunu︐.き

︽

Z‑‑‑e

e︐︐
...
︐︐
? う 門 事 ' M 川 川 J Z M H T M H 争 浅 嫡H
︐︐︐︐.︐︐.︐
==・ ' 2 ・︐=ze'z・'zg・︐
円 nuHMAV U
nU UnunuHunM
HW U M
MHM川口UM円 円 UMHMHnuMH
υ掛け品川川υ

‑‑‑Ee

3・'NNNUHM内ununNHNNHNO
UυuoEGξυotuE00とnR
制問削川UHUHHHHHUHHu
tt''?''?''T''r'
零7 d
レソむ
.︐.︐守宇シリzht
JZJ︐︐︐︐︐
...
︐.︐︐
寝

伺

命明舗網側鵬削側馳勾

﹄

﹄

長

詩

'
s

a

H
1

に

悦

‑膳 nHvnunununuHHV U
︽ n
HunvnU
H
掛けM刊叫川Mい MHMH掛けdH掛けM川uwn
u
nunUM内
円unu門口問日間口問︒RHH刊日開は門ru
u
円 nuza
nununUHununununU
γ
・2 すZ H

﹄

τE
零

に変換して、補助変数を用いてソートする。

唱孟宅

織を&

暢帰
宅ZZ

nunU
︐
.

FU に

'A 4
叶
22't

3 ;w
宮︑}
uh H
︐ ..
︐︐

制時 M同

' ' n u w 抗日W
gzHnMnnυ

ununs‑h
.︐.︐.︐nunuA門
u
打
uunuuv
GOO‑‑N
p
' 山H ' t

NNN''

ιιι Z Z

I

え
JqJ

'Ea命

・骨密

w
‑
‑

n
u
‑
‑z
‑
‑
n
R 唱&
nuzHU
UR︐dnu

END

̲worW=SUsSTR(柵泌 ORO,
J
, J)II子1j
MO=珂;J:J
̲
3
:E
.NlH
NN=rUII対211N311N411N511N61IN711N811N911NI01INllIIN121IN1311NI41IN1S;
J
<
.E
Ep WOR
.O 倫
'
1
10
玖i) I
H1;
PROC SORT; B
Y WURU NN ;

働

φu

嶋

随 一 13は 2偲の補助変数司会用いて辞書順整列を行うプログラムである。伊jえば、次の例のよう

a

氏
問
。
=
・
,
ヘ
IF 向
。
=
,
;
t
, OR r'lo=・
3・
内0=・
市
, 01そ 110= モ'

IF 門0='11 0
7'
門 0='
OK "10='メ'

Mい M同

附
け M町会

1
・
2 ld'

}};

JMHM同・'

民

A門

3MHHUHOnv'
う T T I M n u円
ー
‑‑‑‑czHu
nw‑‑‑Ezsp
す
e・ ︐ ︐
.︐雰器器
onFMHMH 純
一
n
u
72rrs・pr
Z'a'i'i
揖
引

︐

1

辞書頼整期プログラム

カタカナ

思 ‑13

•••

OR 門O='/
.
,
'
内0='フ
・

;{t

'A

u
‑
v
v
'
v
'
H
H
M
A
H
a
u
n
M
H
nuHRnR
p
n
u
n
h
H
H
M
叫
nUAmAnga

﹄

・・OR MO='宇'
ご
'
ヒ
, UK 110='ミ'
lF 向
。
='ウ OR 問
。
='ク'

IF 手.
1
0
= f
MO

・
a
・
・
ト NN J ツ
フ晶 3 主 祭 3
_WURO
ヘ;:t~つ

=

'
.︐
.
︐v
開
叫.
B
‑
r
E
・・
Jv'u‑rHR
民
'
E
a

JRJ・'
・
・
'
a
a・噌 E.. &

留守瓜

同
u
‑
‑
門υM円M
.︐un‑w ・

;NOIl8

V
円

'A︐aM開MHM咋M
H

酔

•

,

2:
制 刷

主 t HnununH
Tし ? ? ? T
cd'轟 円ururu U
円
ru同M同制川M同
AHM同Er‑ptPErt
n
u

'
e︐B・L・‑h・LSEh
A

争

tラ
ヘ
・
ヵ zヨウノ
10=Ml;ITOP=2;
鋳2 怠

によって異なる。
に等価の文字が誼前の
夢
J
Iが綴れる。また、

1
I
憤配

濁点。が 1字分となる ζ とにより,ソートした場合に
カタカナデータは濁点"およ

i
対PUT WORD ¥}‑15 !
I
)l (Ml‑拘15) (
¥ 1.>
;

事

4
6 = 例 0;

円
L

ρ
h
v

61.

ノf ンジー 第一補助変数 ノ、ンシイ 第二補助変数 2 6‑2 SASt 日 j 題 デ ー タ セ ッ ト の プ ロ シ ジ ャ ー 索 引 の 作 成 伊j S A Sか ら 揖 供 さ れ て い る 桝 題 デ ー タ セ ッ ト は 、 SASプロシジャー罵が 187メンバー. S A S /ET S用 が 4 6メ ン パ ー よ り 成 っ て お り 、 銭 的 と す る プ ロ シ ジ ャ … が ど の メ ン バ ー で 用 い ら れ て いるか検索する乙とは でな七、。そ乙で、次のような手順でプロシジャー索引を作成した。 i ) SOURCEプロシジャー会用いて全メンパ…宅金連結し、一つの 1 ) 頃データセットとする。 i i )1行 を lオブザベーシヨンとする。 i i i ) 元 の メ ン バ ー の 先 頭 の レ コ ー ド は J で 始 ま り NAMEぉメン ノすー名となっているので(図ーは) . メ ン バ ー 名 径 読 み RETAINする。 , ./ ADO NAMξ=ADζLUS SSJ=00810930 DATAj JNPUT S1 S5; TITLE ADCLUS EXAMPしξWITH NON CL lQυE SOLυTION; 。 氏S; CA 欄 柵 酬 o• • • , o• • • 今 40. • o3 2 0 • o3 0 3 0 今 ・ a PROζPR1NT; PROC ADCLυS MAXG=3 PRINT=1 OPT=O; i l 4 (G1・G3> (1.) i i l 6 (51) (1.); CA民05; OATA; 1NPυT i 12 001 今 13 001 4 23 001 今 1今 000 0 2偽 010 3 3今 100 2 15 000 0 25 010 3 35 000 0 今5 010 3 PROC GしM; MODEL 51 = Gl G3; TlTし 正 υSlNG GしM TO VERIFY ADCしυ5 凶ElGHT5j ./ ADD NA何E=ADζ しυ52 5SI=00810930 DATA 乙 む し A; TITLE TA5TE AND 5MξLL CHAUTAUQUA: COLA EXPERIMENすS TITし ま2 RAw Dl5SJMILA民ITY JυDGMENTS FROM 今O 5UBJEζτS ABOUT 6 COLAS; z 輔 , 劉 ‑14 SOURCEプ ロ シ ジ ャ ー 結 し た SAS f 9 1 J 磁デ…タセットむ内 i v ) 行毎 1 C文 字 列 'PROC'の 有 無 会 チ ェ ッ ク し 、 見 出 し た 場 合 に は 、 そ の 箆 後 の プ ロ シ ジ ャ … 名 を読みメンバ 名でソートし、 と の セ ッ ト で OUTP むすする。 v) 検 出 窓 れ た SASデ ー タ セ ッ ト を プ ロ シ ジ ヤ を作成する。〈 1 5 ) 一 ‑ 6 3 …

62.

プロシジャー名 SA S{ 7 J J 題データセットのメンバー名 ADCLUS ALSCAL ANOVA :G AUTORE BMDP CANCORR CHA畏T CLUSTER CO鈍TENTS CONVE畏τ CORR COXREG喪 DELETI : DISCRIM uUNCAN 家uITOR FACTO際 FASτCLUS F M τし 工B ADCLUS2 ADCLUS3 主DCLUS崎 ADCLUS ALSCAL尋 ALSCAL5 主LSCAL6 主LSCAL7 ALSCAL8 ANOす鼻持 ANOVA2 主持 OVA3 ANOVA5 ANOVA CANCORR3 F畏IEDMAN NPARlWAY ANOVA8 DIAGNOSE TまST BMDP C員NCORR CA減CO員R2 CANCORR3 CRAS約 五 S RULERS TEST CALEND広R CHA畏T CLUST窓際 DIAGNOS正 お TS CONV 主演 T DIAGNOS E : 喪主持 K CONτ 王 Cと挺 SUS R正ADSPSS SCOR E : : ST CONVま 詫 T DIAGNOS忘 READSPSS DIAGNOSE MAT喪IX CANCOR喪 CONTENTS CO耗R COXREGR DIAGNOSE RANK SO 芋T .PHYS TEST DIAGNOSE DISCRIM LOGIT PREDICT ST DIAGNOSE uUNCAN TEST τまST 正DIτOR DIAGNOSヒ FAζTOR FACτ0哀2 FACTO詰3 害ACTOR持 FASTCLUS T E : :ST VARCLUS2 VARCLUS3 FASτCLUS . LIB2 FHTLIB FMT n : ALSCAL9 ANOVA6 ANOVA7 設EAuOSIR READS長S MULτICOL TEST n : 関 15 FACTOR5 F昆Cτ0畏6 d咽蜘 SAS例 題 デ ー タ セ ッ ト の プ ロ シ ジ ャ ー 索 告 の 作 成 例 7 . あとが念 以 上 S A Sによる文字列の処理伊jの実際を報告したが、 ζ れらはいずれも S A S利用以高官には、 大 き な 労 力 を 要 す る こ と で あ っ た り 、 専 門 的 な プ ロ グ ラ マ … で な け れ ば 困 難 な ζ とであった。と ζ ろで、 S A Sはプログラム として勝れていることが、むしろその組界に を感じさせる ζ とになるようである。たとえば、変数の総数の制服は絞り払われる ζ とを盟みたいし、 配列をより簡単に 2次元 できるようにならないか、などである。 この研究は、北滋道大学大型計算機センタ… HITAC‑ M200Hシステム上の SASを用いて行な ったものである。 ‑64… ・ a

63.

カテゴリカルデータを被う関孫型テーブノレ上の操作と SASによる実現伊j 経済会面斤 剖liIT典子、佐藤英人 1 . はじめに 統計デ…タはカテゴリ化されたデータであり、各カテゴリあるいはその組合わせに対して 臼窃震の高い操作性を要求されるのそ ζ で 、 比 較 的 自 由 度 い構造を持つとされる関係主主 テープル上で統計データを扱うととを考えたが、統計分野で実際に必要となる操作には関議 代数でうまく表現できないと思われるものがある。 例 綱踊 今、表 1と表 2が 与 え ら れ て い る と す る ( 統 計 分 野 で は 部 表 は 決 め ら れ る の で は な く 与 え られているのが普通である)。 ζ れらを閤保代数的 ζ l結 合 ( j o i n )す る と 表 3のようになるが、 ζ れ は 続 計 表 と し て は 不 都 合 で あ る 。 続 許 的 な 滋 味ζ ;合 致 す る 表 4又は表 5の よ う な も の を , 得るには、表 1 を表 l 'ζ 変 換 し 、 表 1 "を経て表 4を得るか、表 fを総て表 5を得なければなら ない。 とこで、表 l→表 Y、表 l '→表 1の 変 換 そ 健 一 属 性 変 換 (1)、表l'→表 γの 変 換 を 繋 約 1 ' 01 (2)とよぶ。 2 . カテゴリ変数とサマリ変数 n個のカテゴリ Cl,. . .,Cnを含むテ…ブルを R(Cl , … ,Cn,81,… , 8m)で表現する。 . Cl,. 一,Cn会カテゴリ変数、 81,. . ..8mを サ マ リ 変 数 と よ ぶ (3) 。 ‑65‑ ζ とで

64.

数 民 業 従 性 級 階 AW 修 業 んと職 表 2 表 3 叩 曜 設 業 平均賃金 曜 韓 業 年令線級 性 業 男総従業員性 数 女総従業員数 性 従業員数 王手均鍵金 吋 日 ~ Jom 叩 性岡県 員数 性 / ク 2 E 疑 ま 4 、 業 女従 性数 一変原明 融問 令 年 職 業 農換一業 値一 n口uV一級 表 1' r 一 一 一 一 一 一 n 職 平均賃金 Jom 一 { 複 表 1 " !職 緩?を 表 5 変換 業│議従業員装!喜従業員経 、と: ト 問 問 問 職 γ Jom 議 長 1 岬 2 0才 職業守ttT主役 ~8 男:1-14 費 量 ‑20才 努絵 女性 6 0才 男性 女性 平均嚢金

65.
[beta]
3
. 餐約
サマ 1
):変数を含むテーフソレから特定のカテゴリ変数を前除する場合、

な結果を得るに

は削除おれるカテゴリによる接続が必要である。

R (C1
,
"
'
, C揖
, CS ,S1
,
"
'
, Sm)
において、 Z 1,
… mとするとき Si を Cs で嬰約したサマリ葉数~ Ssiと書くことにすれば、
ヰ

要約の結果は

R s(C1
,
… C,
持S
s
i,
;
.
.
, Ssm)
となる。乙乙で,各サマリ変数に対する要約方法は変数によって異っており、合計、平均の
ほか ζ れ ら に 加 重 を 伴 う も の 、 あ る い は 最 大 、 最 小 等 代 表 値 を と り 出 す も の な ど が 考 え ら れ
る
。

・

ah

Sjを要約する操作を Fiとすれば

S5i Fi(Si,
CS)

I 二 1 ..・現

"

Rs=S開 問 ( R,{C1"… ,Cn,
} {C5,
} {(
S,
l S5
1,Fl),…, (Sm,
Ssm,
Fm)})
関 1は ζ れを SAS
で実現したものである。 ただし Fi としては MEAN, SUM, SU
怒 WGT
,

MAX. MIN等を

する。 Swはわニ SUMWGT
を指定した時の部愛護数である。

なお、基礎統計値を求める SASプロシジ
ャのうち加重として実数値を与えうるのは

PROC SORT DATAおお波;

UNIVARIATEプロシジャだけであるが、乙

BY C1…C稗;

れについても加重平均をとるにはもう l

PROC UNIV
ARIATE NOPI
ミ
I
N
T
;

ステップ必獲である。また、最終オブザベ

BY C1 …Cn;

ーシヨンの鍍
積値を要約する場

約値としたい場合(
は LAST変数を用

(WEIGHT SW;)
OUTPUT OUT=R5

いる等の技巧が必要となる。

a
削
除

Fl=SSI… Fm Ssm;
〈儲 1)

要約

4
. 値一属候変換
形状は異なるがデータとしては同じ

そもつようなテーブルがあり、その罰での変換が

可能である。

E
ミ(C
l,…, Cn,
C5,S)
において Csが m額 の 儀 U l,…, Umをとりうる

i= 1 … ,
mI
と対して C5口 U iであるよ

うな Sを Siとよぷ乙とにすれば

Rt(C1.… ,
Cn,SJ
, …,
Sm)
への変換及びその逆変換を行う操作が存謀する。

Rt=T(J a(R,
{C1,…, Cn },{Cs,
} {
S,
} {(U1,S1),… ,(Um,Sm)})

‑67‑

66.
[beta]
R T Ea
l
(
1
1t,{Cl,… ,Cn},{CS},{S,
} {(Ul
, Sl),…, (Um,
Sm)})
E

換 Tv
a 及び'T viを SASで 実 現 す る に は カ テ ゴ リ 変 数 Csの 値 と し て S1,
…
, Smの 名 前 を 文
子J
Iで入れておかねばならない。従って次のように簡略化できる。

Rt口 T 君 a (R,{Cl,
リ
・
, Cn},Cs,S)

. {S1,… ,Sm }
)
EtzTEal(EZt,{C1. … ,Cn}.Cs,S
関 2は ζ れ ら を SAS
で実現したものである。

PROC SORT DATA R;
な

BY C1…… Cn ;
PROC TRANSPOSE OUT RT;

BY
I
D CS; VAR S;
,蝿削除

DATA RT;S日T RT;
DROP ~NAME
2 1 )値一属性変換
PROC SORT DATA=RT;
BY Cl…… C持
・
PROC TRANSPOSE 0むT R

Cs))・

(RENA込1E
BY C1…… C匁;
VAR S1…… Sm:
DATA R; SET R

S));

(RENAME (COLl

訓咽

〈
鐙2

2) 純 一 属 性 逆 変 換

実 際 に は Ui と Si!ま持じちのではないし、複数のカテゴりの債の組に対応して Siが決
まる場合もあるので、あらかじめこれらの変換を行っておく必繋がある。また、復数のサマ
リ変数を同時に変換の対象とする場合には個別に行って結合する必要がある。

5
. 結合
サマリ変数号任命むテ…ブ Jレをカテゴリ変数を;f…として
のテーブルが間じカテゴリの組をもっ場合には、

ることを考える。ふたつ

は単なるマッチマージで実現できる。

e
pち、武器 (Cl,
"
'
, C需
, Sa,
) Rb(C1,…, C勿 ,Sb )カ3 ら Rab (Cl,…, C持,Sa.Sb) ぞ
るi
とは
Rabニ JoIn (Ra,Rb,{C1,…, Cn})
関 3‑ 1はこれを SAS
で実現したものである。

ρ0

︒
口

67.

方、結合しようとするふたつのテーブルのカテゴリが異る場合 約 [4]や{直一属性変 換を総合わせる必要がある。即ち、 Ra(C1. … .Cn.Cs,8a). Rb(Cl,… ,Cn.8b) ζ I 関する結合J o i n (Ra,Rb.(C1. … .C持) )として次のニ械が考えられる。 J o i n8(Ra,Rb. {C1. … .Cn } ) " "Jo i n (8ur n (Ra,{C1.….C珂 } , {Cs, } {( 8a,8sa,F)} ),Rb,{C1.…. Cn }) C持 .8sa.8b) =Rab (Cl. …. . … .Cn }) J o i nT(Ra. Rb,(CI Jo i n (Tva (Ra. {CI. … ,Cn},{Cs}. {8a j, {(Ul,8al),…, (Ur n• 8ar n )}),Rb,{C1, …, Cn }) Rab(Cl,… ,Cn,8al,… ,8arn,8b) ・ ah ζ れを 8 A8で 実 現 す る と 関 3 2,関 3 Fによっては ζ の ま ま で は 実 現 で き な い 3のようになるが, J o i n8は 3 .でも述べたとおり .で述べたとおり がある。また、 JoinTについては 4 Cs や Sが複数鰭ある場合はかなり手簡がかかるし、 Cs の{践がそめままサマリ変数名とな らない場合も多い。 DATA Rab; MEI ミ GE Ra Rb; By Cト ー … Cn; (~ 3‑ 1) 単純な P I ミ OC 80RT DATA=Ra; BY Ci…… Cn; PROC UNIVARIATE NOPI ミ INT; BY Cl …… Cn; VAR Sa " " OUTPUT 、 OUTニ RDATA Fエ ニ Ssa; PROC SORT DATA Rb;BY C1・・・… C持 ; DATA Rab; ME沢GE RDATA Rb; BY Cl …"'Cn; 3 2) 要約を伴う PROC SORT DATAニ Ra;By Ci…… Cn, PROC TRAN8P08E 0むT=RDATA; BY Cl … Cη; ID Cs; VAR Sa; PROC SORT DATA Rb;BY CI …… Cn DATA Rab; 担 ERGE RDATA R b; By Cl . . . . . . C刃; DROP NAME‑; (盟 3 3) 値一属性変換会伴う結合 υ 円同 ハ む

68.

6 . おわりに カテゴリ化されたデータに関係演算を有意に適期するため、カテゴリ変数とサマリ変数を 区別することによって従来の務係演算与を拡蝦し、 SASそ 用 い て ζ れ を 容 易 に 実 現 す る 方 向 を示した。 i値 一 属 性 変 換 に お い て は 、 穣 々 の 形 で 保 持 さ れ た デ ー タ が 実 は 司 じ も の で あ る 可 能 性 特ζ とされたデータをデータベース上で実際、にどう実現しておく を示した。このようなカテゴワ f かは、データベースの共用性、鶏芸事をさ王者する重要な問題である。 参考文献 (1) W.K 母れも : C h o i c e si nP r a c t i c a lDataD e s i g n, VLDB'8 2,p p .165‑180,1 9 8 2 . (2) .Johnson:M o d e l l i n gSummaryData,SIGMOD'81, PP.93‑97, 1 9 81 . R .R (3) P.Chan, A . S h o s h a n i :SUBJECT:AD i r e c t o r yD r i v e nSystemf o rO r g a n i z i n g ・ a andA c c e s s i n gL a r g eS t a t i s t i c a lD a t a b a s e,VLDB'81,PP.553‑563, 1 9 81 . (4) H . S a t o:D e r i v a b i l i t yandC o m p a r a b i l i t yamoれgNon‑AtomicData, CODATA'80, p p .565‑568, 1 9 8 0 . 、 綱 i 押 n u

69.
[beta]
伊
巴

︐
.v併巴v

SL

nM

緩H

DF

U

PZ

・

‑
w

V
‑
n
F
転

PF蜘

F3

︒

u
︐
.

UV
AH

Kら

AH

n
n
H

︐
M.

内

︐
.VtEPL

‑
a
'

FHM

U胃

AH

割問

︽M

2a‑

T2
・

内ド

A内

・

・

‑
h
m
u

g
a
u ・'

anψaE

割問

?‑zHunu

nvnu ム内t

匹
P︑
R
AH
AR
TyaC
AH
・' n u

u写

組問

守

門

nM

M問 守 ・ ・ 4

TA

︐
.

ゐ

・
'
At

3

酔

︐
v 4m
s
tcv

・'

t‑hnM
E‑‑hEM

n u A門 γ
'eJW
H U ?2
・ HUhu
sLnrnR
F﹂ AH 割 問 先H
M問 ヤ ETAP‑‑‑W
T‑‑AH

hnU
智

4・・晶︑£官jw'U守

W
J

笥 正 常d 胃4 買

ゴ 表 I、 加 の 創 成

36 J

'i

表

a令

i

噌

︐
︒

表 1'→表 1
'
"

表 1 l→ 主 E
表2 f ‑
拭 リ
情

︐
︐
'
.
晶ζ蜘 制 問 . ︐
令︐

跡

品
.
.
E
ι﹄
'﹄ T
白UTEMn
円ャ︐
AnAHA

問

E n F M同 M同
守

r
・a

診r

nun

乙 ⁝I

nu
︐
v nRF‑u

nR
nr

院M h u n u

E
o一
.
e
・'

詰

図4

311

Z冒J

表表務
↓
↓叶ト

a

を2
・

表表表表表表

﹃

ijil‑‑J1iij

・

ah

前処理
(サブグル…プイヒ〉

︐
も
︐
︑
'
i?u

h

]

寸iii4寸Ill‑iiJ

・
量

37 PROC 50決T DATA=TABLE1;
38
BY OCPATION AGまF
39 PROC P除INTJ
40 PROC 50RT DAτA=TA隠
し E2J
41
BY OCPATIONJ
42 PROC PRINτz
43 DATA TABLE3;
44
MERGE TABLE1 TABLE2J
45
BY OCPATIONJ
46 PROC P鈴INTJ
47 PROC TRAN5P05ξ DATA詣 TABし
王1
48
OUT=TABLE11J
49
BY OCPAτION AGEJ
50
VAR EMPLOYξEJ
51
lD 5E)(J
52 PROC PRINτz
53 PROC U純lVARIATま DATA=TABし
ま 11 NOPRINT;
54
BY OCPATIO総F
55
VA災 阿 ALE F芝鈎 AしE;
56
OUTPUT OUτ:::TABしE12
57
5UM=MALE FEMAし
ま3
し ξ4;
58 DATA TA隠
例ERGE TA隠
し E12 TABし
ま 2;
59
60
BY OCPATION;
61 PROC PR1NTJ
62 PRO乙 TRAN5POき
ま DATA:::TABLξ11
63
OUT=τABLE13U
64
BY OCPAτ10N;
65
VA関 MALξZ
66
1D AGξ3
67 PROC P鈴lNT;
68 PROC TRAN5P05ξ OATA詔 TABLξ11
OUT=TABし
ま 132;
69
BY OCPATIO総Z
70
VAR FEMAし
まF
71
10 AGξZ
72
73 PROC P符lNτz
74 OATA TABLξ5;
75
問ERGま τABLE131<食ま NA附E={
20躍 M
20
76
20 40諮問 20 40
40 60盟 M40 60
77
60
=事~60
))
78
τABLξ132{RξNAME器 (
20=子
20
79
20 40=F20 40
80
40 60=F40 60
81
60
F60
))
82
83
84
85
86

1 SASプ ロ グ ラ ム の 椀 〈 表 4、 表 ら の 作 成 )
円

t

70.

OBS OCPATION AG正 SEX o MALE 1 MANAGER 2 MANAGεR o FEMAしE を o MAし 3 MANAGER 4 MANAGER 20 40 FEMAし ま 5 MANAGER ゐo 60 MAしE … 6 MANAGER 40 60 FまMALE 7 MANAGER MAしE 60 一 FまMALE 8 MANAG忠良 60 9 PROGRAMR 20 MAL王 20 FEMAし ま 10 PROG険AMR 11 PROGRAMR 20 40 例AしE 12 P災OGRAMR 一 20 40 FEMAしE 13 PROGRAMR 40 60 MAしE 14 PROGRA何R 40 60 F定例 AしE … 開Aしξ 15 PROGRAMR 60 一 FEMAしE 16 PROGRAMR 60 20 MALE 17 S正 o FEMALE 18 SE o 40 MALξ 19 SE 20 40 FEMAしE 20 SE 一40 60 MAしE 21 SE 一40 60 FEMAし正 22 SE MAしE 23 SE 60 一 FEMALE 24 S主 60 一 をMPしOYEE 。 。 8 1 15 2 2 。 。 2 55 17 14 。 。 。 。 ・ ・ a 2 30 8 ゐ 。 。 。 (国 4‑ 2) 表 1の内 岬剣除 OBS OCPATIむN AVWAGES 1 2 MANAGER 300000 PROGRAMR 130000 3 Sま (翠 4 180000 3)表 2の内容 一7 2…

71.

OBS OCPATION ・ ah 1 MANAGER 2 MANAGER 3 MANAGER 4 手~ANAG ER 主 例 ANAGER 6 MANAGER 7 MANAGER 8 MANAGξR 9 PROGRAMR 10 PROGRAMR 11 PROGRAMR 12 PROGRAMR 13 PROGRAMR 14 PROGRAMR 15 PROGRAMR 16 PROGRAMR 1ア SE 18 SE 19 SE 20 S ε 21 S芝 22 Sま 23 Sま 24 S正 ・ ah AGE ξMPLOVE正 AVWAGをS SEX 20 例AしE 20 FEMAしE 20 40 MAしE o 40 FξMAしξ 40 60 MAしξ ゐo 60 FEMALξ MAしξ 6 F正MALE 60 20 MAしE 20 FEMAしξ 20 40 MAしE 20 40 FEMAし 芝 ま 40 60 MAし 40 60 FEMAし 在 間Aし ま 60 FξMAしE 60 o MALE o FEMALE 20 40 MALE 20 40 FEMALξ 40 60 MAし 主 40 60 FEMAしξ MAし ま 60 60 FEMAしE 。 。 8 1 15 2 2 。 。 2 55 17 14 。 c 。 。 2 30 8 ι 。 。 。 300000 300000 300000 300000 300000 300000 300000 300000 130000 130000 130000 130000 130000 130000 130000 130000 180000 180000 180000 180000 180000 180000 180000 180000 (揺 4‑ 4)表 3の内 ζ の表だけを見ると AVWAGESは f職業男] 1年令階級号J I性 別 平 均 Jそ示しているかのような印象を与える。しかし策課の値は 表 2の 「 職 賃 金 j であり の元となる。 ‑73‑

72.

。 AGξ BS OCPATION MALE F王将 AしE NAM 1 MANAGξR 20 E州PしOYξξ 20 40 芝MPLOYξξ 2 MANAGER 3 MANAGξR 一 ゐo 60 まMPLOYEE 4 MANAGER 60 三MPしOYEE 5 PROGRAMR 20 EMPしOYEE 6 PROGRAMR 20 40 EMPLOYE正 7 PROGRAMR 一 40 60 EMPLOYξ ま 8 PROGRAMR 60 主 EMPしOY主 一 20 E問PLOYま芝 9 SE 10 SE 20 40ξMPしOYEま 11 S ξ 主 40 60 ξMPしOY主 12 S ξ 60 EMPしOYEE (~護 4 1におけるカテゴリ 5) 。 。 。 。 。 。 。 。 。 。 。 8 15 2 2 55 14 2 30 4 1 2 17 8 訓制 l 'の内容 数 SEXが変換され、 SEX=MALEの EMP ‑LOYEEが rMALEJ 、 SEX=FEMALEのお話PLOYEEが rFEMAL ‑EJ とし、う名前のサマリ変数になった。 OBS OCPATION MALE F定例 Aし ま AVWAGξS 44 378 ﹄ 守 ' 吐 .4 内J ︽J 4 4 A M 円代 D H M円 AMHFMM EA GR M同n u ARE MPS 44 フ 与 党 4 300000 130000 180000 (関委‑6) 表 4の内容 表l'におけるカテゴリ AGEが 要 約 に よ り 娯 除 さ れ 、 サ マ リ 変 数 MALE, FEMALEは OCPATIONに よ る サ ブ グ ル ー プ ご と に 合 計 さ れ た 。 さ ら に 表 2が マ ッ チ マ ー ジ さ れ AVWAGESが麗わった。 ‑74‑ a

73.

OBS OCPATlO鰐 4AaA 気d をd mV ︽M 20 40 40 60 恥 ︐ ︒ 20 544 20 40 40 60 850 剥A例E 品。品。 nunu nvnuhv ︐ 今 4A 4 ・俳句' a U hunv v ︽ ﹄ eECr EE ﹄ 鍾 e﹄ 2 L t ・ z ﹄ Erhgt anaHan M 円 MnMn nR n prFrFr 恥 SRH 輔 P H M m M H g aR A門 戸U M問n u a‑nhRZ﹄ MnpS 20 剣20 40 M40 60 問 品 。 一 一 一20 F20̲'0 芋40̲60 F品 。 一 一 一 AVWAGES F (図 4‑7 ) 表 5の内 表 1 'におけるカテゴリ変数 AGEが変換 8れ サ マ リ 変 数 r 20J 20 40J ・ ah r 40 60J r 60 J が 作 成 さ れ た 。 議 1'にはサ FEMALEと ふ た つ あ る の で 乙 れ ら に つ い て 掴 別 マ リ 饗 数 が M ALE, に 変 換 し 、 後 で MALEIFEMALEの区男J Iが つ く よ う リ ネ ー ム し て 表 2を併せマッチマージした。 ζ のように、複数のサマリ変数をもっ テーブルの A Sではかなりめんどうである。 題性変換は S 一 75‑ nuhuhv 内 ζnvhuw 4a ヲ'aU 4A hvhvhu 200 令 ・ ・ 4. ZJ'h守 ' h司 ぽJ ' J 負Mkdhu ︐ 句 ¢ h u ﹃h 悦代 RUR ‑ ‑ aHRM円 Z A門 戸U u M 開n mpS ・内 1 4 後4 ︒¢﹄nnaMRn OBS OCP員TlON M 20 n u4 内 句ζ 鍾 ezeFhEE S L Sら E﹂ ﹄ 4a44 篭4 ・ ah aHanan 陣HHnMn DR b開 制 円 察恥 AR 器提 AG Ps 幽門 Mm 内H M ARF eA司 ︐ ︐s OBS OCPATlON NAMま 300000 130000 180000

74.

統討データベース実 ‑SAS 上に講築され ヨナリ←ドリブンシステム 三井犠報開発株式合社 総合研究所 佐枝五郎 デーヲベース システム繍発の雪景 官公庁によって発表されている統計与をデータベース化し、統計の利用者が容易に様々な統 データの加工検索できるシステムは f 統 計 デ ー タ ベ ー ス j とよばれる。 ixxxデータパンク j と い う 名 の も と に 、 多 は1 0年 以 上 も 訴 か ら 各 種 の 機 関 で 提 案 さ れ 、 . . くの報告書のみ ζ の穣のシステム されたが、実用的システムはわずか二、三というのが現状である。 その理由の主要なものには次の豆つがあげられる。 寺統計用のデータベース管理システムが不十分であった。 oユ ー ザ ー が 使 い や す い ユ ー ザ ー イ ン タ ー フ エ ー ス が 確 立 し な か っ た 。 ③データのメンテナンスを 的ζ l 行なう体制が確立しなかった。 の理由はソブトウエア技術ょの問題で、 の DBMSの 、ハードウエアの低価格 化など後考慮すればほとんど問題は解決されているといえよう。しかし第三と第三の問題は 相 互 に 関 係 し あ い 、 現 夜 で も 「 統 計 デ ー タ ベ ー ス J を構 るためのネックとなっている。 使いやすいユーザー・インターブエースがないため、ユーザーめ利用頻震が低 ~\o 震対に、 データ管理者鶴は低頻度の利用データを収集し、メンテナンスするインセンティブが低くな りう戸…タメンナンスを行う体制がとれない。データがメンテナンスされないためユ…ザーが 益々遠ざかる。 ζ の が f 統計デ…タベース」を定議する乙とをはばんできたのである。 この間組司会解決するためには、統計ユーザーの使いやすく、メンテナンスのしやすいデ l / f I I " " ターベースを作成することが となる。具体的には次のリクワイヤメントがユーザーブレ と必要とされる。 ンドリーな f統 計 デ ー タ ベ ー ス J 1 <D統計表及び各項闘についての情報をユ←ザーに器供する 岳会括的にデータの検索、更新ができる (J)統計独告のデータの演算のサポート @)グラフ、表、地騒などの多様な表現力 苦手揺婦分析、多 解 析 な ど の 解 析 ツ ー Jレのサポート ヱド楠で、 l ま 、 以 上 述 べ た 課 題 を 解 決 す る ζ と を 臼 的 と し た 「 統 計 デ ー タ ベ ー ス 実 験 シ ス テ ムj について る。本システムは、上に述べた④、③の機能にすぐれた統計解析パッケージ S ASを用い、1::として必、号、舎の機能を充実させたものである。なお ζ の シ ス テ ム は 経 済 警察で主催された「共用クロスゼクション、データベース研究 商庁情報管f とに開発されたものである。 … 77‑ の指導のも

75.

2 . システムの特徴と構成 2 .1 シ ス テ ム の 特 徴 笹本システムは統計表及び総計項目についての情報(主主情報)を、辞書に持ち、全てのデ ータノ、ンドリングを を介して行なうディクシヨナリ…・ドリブンシステムである。 oニエ…ザーはデイスプレー上のメニュー調耐の情報に従いつつ、システムに指;I¥を与える 型システムである。 号本システムは自らのデータベ…スのみでなく、外部の磁気テープなどについてもデータ辞 ー 一 一 (一一一吋町一一ー一一一一ー一一 一 一 書 を 作 成 す る 乙 と が で き 、 多 数 の デ ー タ e ブアイルの一元的管理ができる。 ④定義されたデータ・ブアイルζ i 対し、‑Izレクション、統計、コンパータ 算ジョイン な ど の ユ ー ザ ー ビ A ーが定義できる。 2 .2 シ ス テ ム の 環 境 本システムは、 FAC0M 0S I V/ F4上の SAS配 下 で 稼 動 す る 。 シ ス テ ム 自 身 は SASによって記述され、 れた、 岬町 会 話 型 イ ン タ … ブ エ ー ス に つ い て は P L/I に よ っ て 記 述 さ SAS拡 張 モ ジ 品 ー ル を 利 用 し て い る 0 2 .3 シ ス テ ム の 機 成 乙手されたちのである。 本システムの去を体構成は関‑ 1I 3 . データディクシヨナリ}の内容 本 シ ス テ ム が 持 つ デ ー タ デ ィ ク シ ヲ ナ リ … は 悶 ‑2の デ ー タ ス キ ー マ を 持 ち 、 主 要 な 三 つ のデイクシヨナリーの内容には以下におす寝呂が定義される。 3 .1 デ ー タ セ ッ ト 辞 書 争データセット名、会データセット群名、③定 、 ④ 定 義 8付、信)分野、寄出処ー出典、 号機関、(8)OSファイ Jレ名、c9)外部ユニット名、。外部 VOL.SER名、。プロセス名、 ! ̲ 十 二?32 属性(アトルート)辞書 [( 明性名、会属性ラベル、金データセ I )レドポジシ百ン、争入力フォーマット、舎内部ブオ i~ {D長さ、 1~3.3 l Y ト名、③デ タセット群名、 d 予定義域名、昏フィ マット、争協力フォーマット、 0サマリ一方法、住ウエイト属性、岱徽位、 8轄 震 他 定義域辞書 争定義域名、 、 a (2拐年・初期等、 o定義日付、③定義者名、 ④分野、 (5)コンパータ名、やカテゴリ一種デ タセット名 4 . システムの利用方法 本システムには大きく以下 i と示す 6つの機能があり、ユーザ…はそれぞれメニュー醸言語 i 乙 対する町、苓と P Fキ ー を 選 択 す る こ と に よ っ て 利 用 で き る 。 器 機 能 の 構 成 を 間 一 3I 乙示す。 ‑78‑

76.

, ロ ロ 口 S D B 〈豪語十データベース実験システム〉 T S Sターミナノレ 。 く 外 部 デ ィ ス ク フ ァ イ Jレ 民~ SDBテ イ ク シ 沼 ナ リ ー f l プロセス I I 科 州 ツ ト II アトリビュート I I 主主義填 i l 辞 書I I 辞 轡 II 辞 書 II 静 香i 口口口 内部データファイル (S A S フ ァ イ ノ レ ) 関… l 統 計 デ ー タ ベ ー ス 実 験 シ ス テ ム の 構 成 外部磁気テ!プファイル ﹁ ﹁ jil SAS 回目‑‑1 QQQQQ つ OS IV /F 4 一」

77.

義 域 属 性 データセット GO ζ : : > 関… 2 統 計 デ … タ ベ ー ス 実 験 シ ス テ ム の デ ー タ ス ネ … マ

78.

、 αコ 守 当 告 ( s l 号 ( s l ( s l 岡 ‑ 3 滋 語 及 び 処 閣 モ ジ 品 … Jレ構 @ 守 主

79.
[beta]
4
.1 各闘耐の概主主
(1) 初 期 メ ニ ュ ー 麗 語
初務瞬面は本システムの最拐の画部であって、処理を行なうデータセットの検索、;及び各
への登掻へ進む乙とができる。

{デ…タセット辞書、様性詩妻、

データセットの検索は、<D分野、争出典、合組織名、告データセットグループなどのキー
で検索するととが可能である

Q

5
長
丹 STIC
DATA8ASESY
訂問

汽かにT
IONSC
舵 EN

FUNCTION

1

札

3 FIL
阪

HA
例
区

執す佼S
ET

t‑U椛

聞

0 0岨
PF3

f
司C
i獄詰iXS
1

1
: S
E
A
R
C
H

3
: 舵Id D
ICTIO
附R
Y
(加 す 俗ET)
4
: 蝶Id D
I
C
T
I側 附y(ぬT
T
R
I8
U
TE)
5: 続Id D
I
C
T
I倒 鮒Y<D日明 1M)

SDBASL

・・

a

争ZεXIT

鍋 嶋 一 … … 珊 脚 … 棚

G
E
N
R
E
S
O
U
R
C
E
ぬN
IZ
合T
ION
ORG

DAT向SεTGROUP

毘 ‑4 制 期 メ ニ ュ ー 磁 極

(2) 辞 書 登 録 画 面
本システムの主要な辞替である三つの辞書、すなわち、データセット
義域詳書の霊堂録調簡は関

、続投辞書、定

5‑7にヨミされるものである。

各辞書には 3
.
1
ζ 述べたデータの各内容を記述する ζ と が 必 繋 で あ り 、 般 の 処 理 は 全 て 辞 書
の内容を参照して行なわれる。

(3)処漂踊
各 デ ー タ 々 ツ ト に 対 す る 処 理 は 、 図 ‑8
1
ζ 示されるように、<D辞書きの更新・誇J
I除 、 告 実 デ
ータの検索・入力・ 5
主新、@長想、データセット

義援想データセットの評価、号外部デ

タ‑I!ツトの評価などがある。乙こでは主要な機能である、仮想データセット定義及び外部
デ…タ‑I!ツトについて述べる。

‑82‑

'

80.

E : 久仏 ST 前 I S T I C 会 主 係以後 S YST E ! ' 1 OAT : t O A τ部室τOEFINITIONSC 舵部 UP‑ P F4D O ω N‑ P F 5 : ClτY 昏余裕認す糊例区 FIELD 言筏波C E 。総州I Z A T I O N α芳寝耳定NT SUB ‑ o EFINIτION END・PF3 OATAS 芭TG 部U P 会R E 合 EP 台 熊 I :S C 椛N : : 部: 亡 命T 1 1 / お/ 82 ζ : τ γ NA 円EC A τ芭<lO夜Y ~唱しtJE I N T E 州 向L ペXT訣 揃UVI前 鋭 、/TI例E SERIES Y N N N e l N T E R 憎 し む 余 裕 立T0 主S C R I P T I SfILE機 械 S0 8ASE 1 1 / 2 5 / 8 2D 4 る0 0 11/25/82D 4 る0 0 0 e EXTERN 白 し む 会 孫 認 す 慌S C R I P T I O N 口市部札 o s ゆS N E X ‑ I J O I . . . . . む‑ V L 9 9 特 叡ベ剣I T LA 夜し OS ‑D SN DSN‑NQ 8L KSIZE 斑C FM LRECL FOR 狗A T . . . . . . . . . . . . . . . ・ . . ・・ ・・ ・ . . . . . . . . . . . ・・ . XDSN 1 04600 側科 目叫 叫 叫 帥 叫 材 料 仲 . . . . . . ・ . . . . . . . . 仲 村 材 料 . . . . . T 欄 醐 円由 CQtI附打 "・ ・ . . . . . . ・ . . ・:TI SξRIERSO A T A S E T0S C P T I 側 . . . . ・ . . . . . . . . . . . . . . . . . 帥 帥 * S TY E A RA OD υIRn 綜 込 ee 絃伽 舵N S H U 短 説J 正 Fl 船純計 LAST Y E A RA 憾 P ERIOD ‑ 一一一一一一一一一…………一一一一… : ‑ 5 データセット登録闘 ・ a 内T T R I B U T E0ξFnUTIONS C R E E N :SCR寵~ O U T P U T ¥2 0 . I N T E R N A L ¥2 0 . S U I ゆ担当食Y O R I υ E N ⁝ m m m τ 合8LE 部品。芝FlN 1TION 一伊統 U同叫円 CO 妙絞N T 一隠れ 嶋 ⁝ぽ地ぽ時 一燃焼刻 一館山邸機 削開 UP‑ P F 400 泌‑PF SD U P‑ P F 6E ND‑PF3 ⁝Tvm ⁝ mmmz 校 一諜 w ⁝ mM関内問 掛叶STICえ 。 ぬT A8 倍 ES Y ST E T ! XATR 1 LD 紛れ4 20 料 川 村 川 川 帥 仲 村....τABLε TIRI JT CRIPTION. . . . . . . . ・ . . . 叫 叫 川特 . . . . . . . . . . . . . . ・ ・n・ ・su RYATI IBUT SCRrPTION. ・ 事 ・ ・ . . . . . . ・・ ・ ・ ・ ・ ・ * ・ ・ ・ . . . . . S U T I I G H TA T II U N I T PRC 1 S l . . . . . . . . . .* 叫 判 ・ O R I ¥ . NA τ τ I B U T E O E S C P T I 件 付 村 叫 叫 . . . . . . . . . . . . 材 料 . D R 1 V E NATI I B U τ z e 食 附守合 側 椛 奄J O 災 郎花 附ぬ 箆 絞 窓 会 主 主 向 ?会怠し芝 N 内 側 広 ' E 国一 6 欲孫会 I N m 悦 I立 し門出獄 A m糊 a e 芭 印 唱 伐4 災 FORMULA ・ 宍 をひ芝 鰯性愛録題面 O E F I N I行 部 記 舷 側 UP‑ P F 40 αJN ‑PF ちO UP‑ P F 6除 1 0‑PF3 •••••••••••••••••••• GεNERAL00 舶 I N OESC食I P T I O N 間 閉l NN 白椛 CITY 附JI1 E 以E 内 角I NL 必定L F I E L O 仲 村 川 叫 c o 附 恒N T 乱 . 1 8 ‑ 悦 ヨF I N I τ Z部 C O D E ( C I 宰/し〉 I ' II S S I N G 1 鰍~ID :S C R E N : X D α可 同: 1 . . 叫 . . . . . . . . . . . . . . . . . . . . . 仲 凶 の 印 刷 出I TSEC斑 TUR6ENTDISCONτZぬ政.IS N I J I I 慰 I CFLAG 。者宅佼 L E N G T H ι U E 船X I減Jl宅悌 m椛減量宅 VALl疋 押 材 料 叫 材 料 叫 . .C GOYVAUE DESCRIPTION. . . . . . ・ . . . . . ・ ‑ ・ ・ . . . . ・ . . . . . C A 1 J R YD A T A S E τ 山 仰 向 付 . . . . ・ . . . C O t ω ER DESC P T I捌 . . . . ・ . . ・ . . . . . . . . . . . . . . . . 叫 叫 R I NH 合従 定鋭 。 I J 明 民糊 白隠 L怨仮決 α 輸I Nt 幅制E 佼 し 依す 氾 α》問問T E RDATA 箆 τ終処唱E 鴎… 7 ^主義場登録画語 ‑83 …

81.
[beta]
t~rlSTIC会L
OATABASE SYSTEM

:
:

0併 合S訂
B
R
O
I
J
S
E
UP‑
P
F4 D
α必1‑PF5

END ‑PF3

附

;sc決議; XOS8
1

:

一

F
る

ぞ JVFh

FUNCTION 0ξSCRIPτ1保

5‑‑‑‑

r
r

C依 然7佼Y
PREFECT
き
c
α'
l
P
U
TεR

Fr時 制

cJvaupLF
﹂pbpLV揖 H

CびI
T
Iト定N

nHMτ&UH
DHed?zT'yeマ

n
u

3FL
GUAnA門会An
a

悶123456

D会T
A
S
E
τ
合終Y
COMP
CITY

詑R
EEN

U => U
P
D
A
T
E0合τ会 話τDICτI部会民Y

o==> 0正LETEDATASETOICTION合RY
白コ)9
ROωSE A
T
T
R
I
B
U
T
ξ

L => 9Ra
路 E RE
低 泌 す 会S
E
τ
1==> INPUT REAL O
A
τ会S
E
τ
v =>υIεW DEFINITION
1
JE
IJALUATION
E ==>υIE
C=
=
> OATASET CATAL06
x=
=
)1
~lF'!J T
王XT. (
:
<
台T
A
乞ξ
τ
y ==>(
!
U
T
P
U
T EXT (
H
ミτ
A
o
:
;主τ
0

d鴫
目
・

国一 8

データセット検索画面

ヨ〉援翠データセット
仮 想 デ ー タ セ ッ ト は 実 際 に あ る デ ー タ セ ッ ト に 対 し て 、 特 定 の ビ ュ ー を 定 義 し 、 それを言葉
離に利用する場合 i
と実際のデータセットとするものである。 乙 の ビ ュ 一 定 義 に は 、 属 性 の セ
レクシ晋ン、 ブ" 0 ジェクシヨン、 コ ン パ ー ジ ョ ン な ど が 含 ま れ る 。 例 え ば 原 デ ー タ セ ッ ト に

業小分類別の従業者の表があった場合、 ユ ー ザ ← が そ れ ぞ れ 用 途 に 応

時村別、

は、fEt:護

じて「室長北地方の都道府県別、産業中分類震の従業者 jな ど の 表 を 定 義 す る 乙 と が 可 能 で あ る 。
ζのような形でマスター

L
つという ζ とがなくなり、 ニ

認の影

そしてディスクエリアの効

o外 部 デ

轟の辞書の定義のみが必要になるだけとなる。
タの斉合性が保たれるというメリットが生ずる。

ア

'

タセットは磁気テ

プ 、 あ る い は O Sデ ー タ セ ッ ト の 内 容 を デ ィ ク シ ヨ ナ リ ー 上

理するものであり、あらかじめ辞書にテ

プフォーマットを登録する乙とによって、 自

タセット与を内部の SASデ

タ セ ッ ト に 変 換 す る ζ とが可能となる。 乙の

的に外部のデ
機

アップと、

ザ

タセット

外部デ
で

となる表を一つ格執しておけば、複数の利用者が様々な表を独

によって、従

テープフオー?ツトなどの書類の整績が不完全なため、必要なテープが読

めないなどという関議選が解消される。 そ し て 統 計 の 各 項 岳 レ ベ ル ま で の 情 報 を デ イ ク シ ヨ ナ
し、必要なテープの所疫が解り、 自動的に手]
1現 可 能 な デ ー タ セ ッ ト が 生 成 さ れ

から検

る乙とで、、 ニエーザーの

5
0 間

カi
立、極めて低減される。

と今後の

間関

したシステムは論理設計の妥当性とユーザーの覆いやすきを評価するための実験

と
システムである。 そ の た め い く つ か の 問 題 点 が 今 後 の 諜 題 と し て 残 さ れ て い る 。 乙 の 諜 題 i
ついて、必ユ

ザ

インタ

ブエース、

o 行速度, フ ァ イ ル 容 量 、 に つ い て 述 べ る 。
一 84‑

82.

司〉ユーザーインターフ z ース ユーザーから見て、辞書も実データセットも同ーのデータセットであるので、辞警告〉実デ タも共通の菌留から検索しうるセノレフディスクリプテイブなデータベースに繋醸した方が ユーザーにとって理解がしやすい。 また現在のインターフェースでは画面の動きが一方向で窮屈度が抵いため、自由に各闘聞 にアクセスできる機能、顕在百を二分割して二つの情報を見ながらユーザーが できる ζ と ましい。 ζ うした点については次の o実 行 法 度 e V e r s i o nの ユ ー ザ ー イ ン タ ー フ エ ー ス を 現 在 検 討 し て い る 。 ファイル容量 複 雑 な 辞 警 の 操 作 を SASによって行なっているため、どうしても実行速肢はおそくなる。 で は 一 つ の 語 語 か ら 次 の 画 面 ま で の 実 行 時 間 が 2‑ 3秒、かかり、気の短いユーザ…には . . 適と言えよう。 乙 治 時 鍾 安 解 決 す る た め に は 辞 書 の ハ ン ド リ ン グ 部 分 を DBMSイヒする ζ とが必要で また SASーとでの実行迷疫を速くするには S AS8 2V e r s i o nの?クロを利用して、 SASプロ グラムの効率イとを計る乙とが可能であろう。 いくつかの問題点、はあるものの本実験システムは一応実用的に稼動するものであり、 懇のプロジェクトに利用している。 当主持究所の業務上多くのプロジェクトがその吾的に応じてデータを集め、ファイル f とする のが現状であり、データのフォーマット、ヒストリーは各担当者のみが知るという状態であ った。 ζ の シ ス テ ム の 導 入 に よ っ て 、 他 プ ロ ジ ェ ク ト の デ ー タ を 有 効 利 用 す る ζ とが可能に なり、ムダな入力、ファイルの保持がへりはじめているのは事実である。 後、本システムの浸透により、かなりの効果が生じる乙とが期待される。 " " ︒ 口 phu

83.

CCUシ ス テ ム に お け る SASの、活用 ‑SAS/CMSイ ン タ ー フ エ ー ス の 開 発 ー 徹 郎 村 河 准国 ニ裕 タ木村 ン青野 セ 病昭利 人博茂 成 立嶋杉 府三若 阪 大 住商コンビュータサービス 松村純一、松尾正夫 1 . はじめに 大阪府立成人病センターでは、昭和 5 2年 の 新 病 院 開 院 以 来 、 診 療 デ ー タ の 蓄 積 を 図 っ て き ・ ah た(図 1) D A T AU T I L I Z A T I O NS Y S T E M . F i g . lC o n c e p to fc l i n i c a ld a t a b a s es y s t e m しかし、蓄積された「データの活用」という点からみると、定型的な集計、帳表作成処理 については、さほど問題はなかったが、非定型的なデータの利用や統計解析的な処理となる と、適切な既存のソフトウエアもなく、 D P部 門 と し て は 、 個 別 に ア プ リ ケ ー シ ヨ ン プ ロ グ ラムを作成して対処せざるをえなかった。また、昭和 5 5年 l 乙、病院情報システムの一環とし ての汎用中型コンビュータを、 IBM370/138から同 4341へ 移 行 し た の を 機 会 に 、 オ ベ レ ー 予f ングシステムに VM/DOS/VSEを 採 用 し 、 定 型 的 な 業 務 は DOSのもとで処理し、 VM/CMS のもとに診療データの「利用システム」を構築する乙ととした。乙のため、回和 5 7年 4月に SAS/CMSを 導 入 し て 、 エ ン ド ユ ー ザ へ の 教 育 、 シ ス テ ム の 整 備 を 図 っ て き た 。 87‑

84.

とのような経過のなかで、唱和 5 7年 1 1月 比 当 セ ン タ ー の CCUシ ス テ ム ( 急 性 心 筋 梗 ccむ に お け る デ タ 解 析 機 能 を 充 実 す る ζ とによって臨床研究をサポートする乙ととした。 ccuシステムへ の集中治療システム〉が再開発されるにあたり、 の利用にあたり、 SASを活用して、 SAS/CMSとDL!Iデータベースとのインターフエース、および SAS/CMS とエンドユーザとのインターフエースを開発したので、乙乙にそれらを紹介する。 …GWSFi 2 . C CU シ ス テ ム の 概 略 システムはモニタリング、データ i 反 集 、 デ ー タ 利 用 の 各 サ ブ シ ス テ ム よ り な る ( 醤 2) 。 百台千円 I 民 咽 . a f l Z 下手即日 市 『 g a F i g . 2C C Us y s t e mc o n f i g u γ a t i o n fモ ニ タ リ ン グ シ ス テ ム J !主、血圧、心拍出量、心電図、不整脈などの数傭・波形データ 会計浪) 1. 表 示 す る マ ル チ モ ニ タ 群 で 構 成 さ れ 、 常 時 、 オ ン ラ イ ン で 患 者 デ ー タ を 表 示 し 、 異 ζ l アラ…ムを出すなどの機能を有する。 iデ ー タ 収 集 シ ス テ ム j は 、 モ ニ タ リ ン グ ス テ ム よ り え ら れ る オ ン ラ イ ン デ ー タ を 1分 毎 に 収 集 し フ ァ イ ル す る 。 ま た 、 個 々 の 患 者 に つ い てのオフラインデータの入力と、 CCU入続中の患者のデータ管理を行う。 収 集 dれずこオンラインおよび、 k フラインデータは、 ‑88‑ fデ ー タ 利 用 シ ス テ ム Jζ I定 期 的 に フ

85.

アイル転送される。 ・ a R E A L TIME MODE F i g . 3D a t ar e t r i e v a l &a n a l y z i n gs u b s y s t e m . . デ…タ手1 ' 用 シ ス テ ム ( 図 3)は、 IBM4341上に構成され、 C C U患 者 に つ い て の デ ー タ ベ ス令構築する。データベースの内容は、 C R T端 末 よ り 照 会 、 検 索 が 可 能 で あ る 。 ま た デ タベ…スから描出したデータについては、 SASを 利 用 し て の 統 計 解 析 処 理 、 そ の 結 果 の グラフ表示、組掃のハードコピーの作成が容易に行なえるなどの機能も有している。 3 . SASICお1 Sに お け る イ ン タ ー フ エ ー ス こ ζ で は 、 デ ー タ 利 用 シ ス テ ム に お け る SASICMSと DLIIデ ー タ ベ ー ス と の イ ン タ ー フ エ ー ス 、 お よ び SASICMSの エ ン ド ユ ー ザ ・ イ ン タ ー フ エ ー ス に つ い て 紹 介 す る 。 3・1 データベース SASイ ン タ ー フ エ ー ス C C Uデ ー タ ベ ー ス は 、 D O Sの も と で 智 朗 さ れ て い る た め 、 C M S環 境 か ら は 、 街 接i とは読めないし、 SAS/CMS安 利 用 す る こ と も で き な い 。 そ 乙 で 、 わ れ わ れ は C M S環 境 下 で 読 め る D O Sフ ァ イ ル 上 κ、 デ ー タ ベ ー ス か ら の 抽 出 フ ァ イ ノ レ を 作 成 し 、 S A Sデ ー タ セ ッ ト へ 変 換 す る 手 法 を 採 用 し た 〈 関 4)。 ‑89一

86.

PLjI APPL.PROGRAM UNDER DOSjVSE AIa UNDER VMjCMS UNDER SASjCMS a Fig.4 Database‑SASjCMS interface つまり、エンドユーザは、オンライン画面より検索条件を指定し、データベースから所要 のデータを中間ファイル上に書き出す。 そ の 後 、 端 末 を CMS端 末 に 切 り 換 え る 。 端 末 の 切 換 え は 、 端 末 か ら の コ マ ン ド 入 力 に よ り可能である。そして、 CMSIDOSの 機 能 を 用 い 中 間 フ ァ イ ル を CMS ミ ニ デ ィ ス ク に コ ピ ー し 、 そ れ か ら SASデータセットを作成する。 CMS環境に入ってからの操作は、 CMS/EXECコマ ン ド に よ り プ ロ グ ラ ミ ン グ さ れ て お り 、 次 に 述 べ る SAS/CMSエ ン ド ユ ー ザ ・ イ ン タ ー フ エ ー スの一部として組み込まれている。 3.2 SAS/CMSエンドユーザ、・インターフエース C C Uシ ス テ ム の 開 発 に あ た り 、 エ ン ド ユ ー ザ と 必 要 な デ ー タ 解 析 機 能 に つ い て 検 討 し た 結果、次のようなととがわかった。 Qd nU

87.
[beta]
分析、単純な時系列分析、 データのグラフ化など、

(
J
) データ解析機能としては、
比較的単純な処理が頻繁に求められる。
ヂ
ノ

o 必要な処理機能に対しては、対

タや期間などのパラメータが変るのみで、処理ロ

ジックそのものは共通化できるものが多い。

号
ミ

については、 S A Sを 使 っ て 積 極 的 に プ ロ

エンドユーザ、は、上記のような基本的な機

夕、、ラミングしてやってみようという姿勢ではない。

ζ れは龍床医を中心とするエンドユー

ザ、にみられる一般領向である。
理という点からも考慮して、 SAS

そ ζ で 、 議 本 的 な 機 能 に つ い て は 、 S A Sプ ロ グ ラ ム の

ICMSエ ン ド ユ ー ザ ・ イ ン タ ー フ エ ー ス を 崩 発 す る ζ ととした。 インタ
ヱ
ニ

.

と し 、 初 期 画 面 ( 図 5)で 必 要 な 機 能 を

関

選択、 もしくは

フエースは、メニ

当 醐 面 〈 図 6) で項 Eの

択し、

丹臼などのパラメータの入力を行うようにした。
ザ、は S A Sの プ ロ グ ラ ミ ン グ を

このため、 エンドニL

識しなくてち

本的な処理は実行

でzきるようになる。

聖
母

S

ー
+

主 ・
*

内

寺
)
.

(
.
争
t 争

争
毒

・
*

.
)
t 事
{
・

争
{
・

争
〈
・

属官民宵

毒
)
.

〈
・
ヨ
o
: 争

・
* .:M;事

(
.
争
f i

争
時

争
毛

華
)
.

*骨+ ・* 時+

争
寺

《

S

む

付

《

h u胃

t
オ

‑
.
.
.

2

t
a
.
︐
︐

.
ど
〉
為

}
{

J

'
‑
h
r

5
.

そ
ー

・
t
)
.

,
1
.
)

.骨
)
.

.
)
(

《

事
寺

き
毛

事
毒

毛
‑
発
? 事

*

T

《

フ

T
r
t
l
l

"

'
)
'
1

:
セ宇

発

ー
+

?
ゐ

毛
事

*
1
(
.
・

事
t

時
* .jf 争
M s*・

N

《

γ

D

︐
rps

甘併特冊以宵

M

×

今

d

司
長

胃
M 袋 繁 栄 艇 長 持 持 持 特 持

S

争
時

ツ

背後持併後掛

M

.

)
(
・
t .

争4
・ 争

l
J

t

争
を

.
.

*

繁栄養蛙胃炎

争
〈
・

MW

事
善
策

争
寺

キ
;

を
ー
発

争
毛

争
〈
・

J
i
":
}
コ
ーzウ

*
. 争時 *・* ・:(). 寺毒 争毒 司h 争毒 争寺 争時 告を 争時 ・* *・* .jf 争時 争普 事毒 寺号

*普+

併

争
時

ト
10民医ぬぬゐ
I うフヲ~U

ク
ヲ 11 t
J
.
(

6

9 J

F
iき.
5 Grand menu panel

‑91‑

時
・
* 争

88.
[beta]
号
)
.

後

事
毛

争
骨

を
ー

を
ー

争
時

~.

'
1
:
会

争
時

事
毛

~~

号
争
4 予

争
時

争
毛

争
寺

毛
き

(
1
・
* ・

普
・
* 争

2

D

6.. ^

*・* む M S

事
〈
・

1
(
. 争
時

争
骨

M
官

・
ひ

M
骨併秘

1
'
)

を
ー

T

M判

・
* .)~・

~.

争
時

U

,
* ~f

事
母

骨

M
背後民宵

.
)
(
. ‑
頁
・

・
民

*

M
宵

A

H

・
,
(
1

ー
ー

M
宵比宵

ー

毛
き

事
時

後

比
宵

誕百以官製

手
を

ー

H

MW

5
3
a

•

"
"
!

M︐
V 俊民世話い話一

l
'

,
寺
会

v
J 子z

る&

む

《

r雪

'J

且伺

z
︐命き‑

'
q
e
z

ZTV 背

《

c

育
担

1

l
ベ
i4.
,

言
'
1
:
を

!
i
":
:
J
] ウヲヨう:):;" フ
う{II サ イ ( j
'

善寺安保

D
者
ぞ

i今 〉

州
‑ 時
+

.
)
t

*

争
キ

(
.
争
4
・ 争

争
モ

争
(
.

事J

1
¥
'

..
ー

骨
u

当争終決養老長較検事:快寺奇怪後後

下
落

V
背骨

1~L

ミ
2
等

袋発足宵民宵

品胃炎

ト
l

。

C

B
. 、
9.

併後発.骨立宵リ官

:
5
仇

1
全

〈
・
1
I争

C

事
毒

後

Fig.6 An example of sub panel
インタ

フエースは、

コントロ

C誌 SIEXECコマンド i
と よ り プ ロ グ ラ ミ ン グ し ( 図 7)
、 画面の

Iレを行う。

また、 そ れ ぞ れ の 機 能 に 対 し で は 、 変 数 名 、 定 数 な ど を ノ f ラメ

タイとして作成した iSA Sス ケ ル ト ン プ ロ グ ラ ム J (悶 8)が対応し、 乙れらは C M Sフア
イルとして作成しである。

PANEL DISPLAY
PANEL CONTROLE
SAS EXECTIVE PROGRAM
EDITTING

・

a

UNDER VM/CMS

むND
王RS
AS/CMS

Fig.7 SAS/CMS enduseγinterface
側

‑92‑

89.
[beta]
日

AM之い回iG円︒︒︒

パm
WCwぷ的 ω叫ωhpoω戸内回廷の×mwcd﹃∞・mvfL
震の仏mwOLa CCV

円宇

ptepHX︽定Fru治i鈴問︒AVAV

同士︑uF52HZFFM持ーかNMGGAmw

一G H H H 江 川 一 ﹀ 2 v ︽ 知 i A w m G G G

叫ザ︽持川口‑FHZHF︽MFiト引品川VGG

了会誌が‑M﹀トvGMm;れ討GGAU

目︒誌伊︽MF3hi円山口AWAUG

刊︒日目伊︽いmmW3Mi

oNGGe

件︑

zx︽定ザ︽添いい一一2HV︽M22吊問︽vr引﹄﹂F品川弘い山定士弘治い九円︽JF︽﹂NZHZF︽・舟×︽定VFMMFZ一一一︽‑FUMh一imwFGGAV

x
‑

¥世相*¥iAW

GAVG

叩

⁝z ぷ ‑ w ‑ P F ︽ ﹄ F i l ‑ ‑ i 工 広 C Z 世 ︽ ︾ ド ・ 米 ¥ ! 々 F 0 0 0

やむ ‑MZへ わ い ‑ P F r u ﹄ F i i i i l z z ぷ ︽ ザ ︽ 派 結 蕊 ¥ i 鴨 川 町 v o e ︒
R Z ヘ 川 沿 一 円 門 い わ れ 2・かじmmzhu‑

zhuヘ持品ヘ×︽ZF︽MFiiiiizxrw広士丸山Fdvt4¥i・問一FGvee

マ宅唱44中

噌4

込

刊号喰.︑

4・

4e

v鳴屯屯

+

喝を一 ‑
i

vfMMmi:iiiト何︽J伊︽︾々︑山本¥ieFFAUAUG
円£e4f十議考︽宅

心
的
︽
川
町

︽rh山7Ftu山.2uui

‑93‑

叫AWμ口一ム×︽W4v︽知iNUNUAVGAW

トロ円以一円・いい}‑GmmUGAV
4

よ
︾ {HZUT一↑;ヤ討会合会

ト
・4

4V︽也F03山内ヤ︽Mm3h川伊︽MFM仙川山﹀トFrw戸工ぽCZF︽みi内UVGGnv

沿い門トFmhふ

i
ム

¥定志γ本家申4・ 不本宮本来本本家定日本海ヤ世相山本*本山本本家家世帯家総紘一山家帝都中晶γ*山本家本本車山本也市啄本本家本京本本本家本宗本家本家本文・定山本本京也事山本本本¥;ト一vmwAWG

¥家﹃い

・+・4e

的考eey守屯44

v︽MFiiiiiZ︽一wX七%いmmんや小¥im口FGAVG

¥寧ヘいね芝︑⁝一ヘ︐件hhrトCm

¥率九段

Awe

〈ζ

いま︺ 一 ︽ ﹀ J r M H ト 一 一 一 之 H F ︽ M F i i i i i い 一 一 一 Z H V ︽ 決 門 家 ¥ : G F A U令 令

ハ
'
v
m
w

、守"

.

‑
u
.
.
.

¥本記2.J︽﹀玄︽UT
々々

剣恥

vuuuxz J C U Auf立川一之HJ hvmん誌記N一一一向

コ

•••

¥本い⁝一2JRt﹀JFtzH

定

ト毛e44+喝e

、、

90.

関 商 よ り 選 択 、 入 力 さ れ た パ ラ メ ー タ を SASス ケ ル ト ン プ ロ グ ラ ム に 埋 め 込 み 、 実 行 時 の SASプログラムぞ作成、実行し、処理結果を CRT I ζ 表 示 、 も し く は CMSファイルとし て出力する。 以上が、 SAS/CMSヱンドユーザ・インターフエースの概略であるが、エンドユーザが、さ らに詳細な解析を行いたければ、通常どうりの SASプログラミングが可能で包ある。 4 . まとめ ζ ζ に 紹 介 し た イ ン タ ー フ エ ー ス に つ い て は 、 わ れ わ れ の シ ス テ ム が VM/CM S環 境 を 前 と行う方針である ζ と (SAS 提としている ζ と、データベースの管理を DOS側で基本的 i ICMSの デ ー タ ベ ー ス 機 能 に つ い て は 、 デ ー タ 保 全 、 定 型 業 務 に 対 す る 効 率 な ど の 点 か ら 未 分でないと考える。)などから、一般的に他の SASユーザ、に適用できるものではない と今えるが、われわれの意図している、 SASも含めた「診療データの活用 j 環境の整備と いう問的には大いに有用であると考える。また、乙れらのインターフエースによって、 ・ a ・ ・ SA Sを利用できるファイルの拡張、基本的な機能の乱用化が可能となった乙とは、 SAS本 来 のもつ解析機能をいっそうたかめるためにも必要であると考える。 今後の方向としては、今回作成したインターフエースは、 であり、 CCUデ ー タ ベ ー ス 等 用 の も の ζ の手法を、われわれが管理している地のデータベースの利用者のためにも、より 乳局的なインターフエースとして開発する必要がある。また、より高度・複雑な機能に対し でも一般的な SAS スケルトンプログラムの開発を行い、~師を中心とするエンドユーザの ニーズに柔軟に対応できるようにする乙とである。 a ‑94‑

91.

SI KAN11の開発 三井情報開発株式会社 佐 枝 三三部 /;日鶏エレクトロニクス株式会社 ¥ 中村新一 1 . はじめに 日本語ζ i欝 す る ハ ー ド ウ A ア 、 ソ フ ト ウ エ ア の 充 実 に よ っ て 、 演 算 結 巣 を 日 本 舗 で 出 力 す る能力は、ソフトウエア・パッケージむ必須の条件となっている。我国で鍔発するソフトウエ ア ・ パ ッ ケ ー ジ は 、 設 計 の 段 措 か ら 、 と の 点 ぞ 考 慮 す る ζ とが可能であるが、 SASのよう なアメリカで製作され、確立してしまったソフトウエアは、墓本から修正するというととが 極難である。 ・ a ζ の 観 点 か ら 、 三 井 情 報 開 発 及 び 日 醗 エ レ ク ト ロ ニ ク ス の 障 者 は SASの本体にはふれず、 SASの出力結巣を利用し、 B本 認 辞 書 を 用 い て 、 日 ステム S I KA N ] 1を 開 発 し た 。 本 シ ス テ ム は 出力を得る、漢字レポート支鐙シ FACOM/OSIV F4の JEFSYSTEM下 で 稼動する。 1BM/MV S.HITACHIIVOS VERSION ちリリースする予定である。 そして、 2 . S/KANJIの シ ス テ ム 構 成 SI K A N J Iは SASモ ニ タ ー の 配 下 で 動 作 す る 2つのプロシジャー友ひ。テーブノレウエアより 構成されるの . ( 1 ) PR0 C KA N ] 1 (日本語出カル…チン) ( 2 ) PR0 C K L 1ST (ユーザ、日本語 ( 3 ) SA S 臼 キーワード辞 の検索ルーチン〉 テーブル S/KANJIは ユ ー ザ の 日 本 語 辞 欝 そ SASデータセットの彰式で持ち、 SAS日本諮ニトーワード S / K A N J Iは ユ … ザ ー の ζ れと、標準提供の If f lして日本語変換を行なう。 を手J した変数名,タイト Jレ名を用いた SASの 実 行 結 5 裂を, PROC PRINTTOによって作業用ファイ lレに出力し,その出力内容をユーザ 日本語辞意警, SAS 日本語キーワード辞書受参照しつつ日本語変換するシステムである。 S/KANJIの シ ス テ ム 矯 C:示す。 素 と 関 連 関 を 図 1I 3 . 日本務ユーザー静警の形 日本語ユ…ザー辞苦言は SAS タ セ ッ ト 上 に 作 ら れ る 以 下 の 3変 数 の デ ー タ セ ッ ト で あ る 。 < D KEY; 変換すべき ② の 単 語 (SA Sの変数名,タイト Jレ名など〉 TYPE; 白 本 語 入 力 の タ イ プ X : 1 6進コード K: K 1S コード J : ]E Fコード (FACOM2進コード〉 ‑95‑

92.

< I DC O D E ; 日本 語 入 力 変換碍能な日本語の最大長はお ま で で あ る 。 ま た 、 辞 惑 は KEYの ABC U 聞にソート されていなければいけない。 関 1 S/KANJI<Dシステム構成要素と関連盟 OS IV/F4 SAS モ ニ タ ー .. ー SAS S/KANJI PROC (SASデータセット〉 .CHART PROC KANJI .P1 ミ INT / 'GLM ーその他 PROC KLIST ~ 山 ← 96‑

93.

4 噌 S/KANJIの使用伊i S/KANJIの 科 用 法 は に 簡 単 で あ り 留 2に示した で あ る 。 基 本 的 に は 二 つ の ス テ ッ プ ヨ〉ユ SAS の コ マ ン ド に よ っ て 実 行 可 能 ザー辞書の oPROC KANJI の 実 行 を 鏡 、 行なえばよい。 PROC KANJI の オ プ シ ヨ ン の 味は次の りである。 ミINTTO で 出 力 し た フ ァ イ ル の フ ァ イ ル 番 UNIT: PROC PI DATA: ユ ー ザ ー 辞 書 の S A Sデ ー タ セ ッ ト 名 図2 a 除 ・ DATA SET FOR USER DICTIONARY FILE VARIABLES: KEY 7 TYPE 1 KCODE 14 DATA UDIC: INPUT CARDS: SEX SMPL ZONE AGE ]OB 1NCOM CONS FOODS HOむS FUEL CLOS MISC AI0 A20 A30 A40 A50 A60 A70 VAKKkkkkkkkkkkkkkkkk ・ ah S/KAN]I の 使 用 例 CHAR ALPHA CODE IN SAS . . . K IS COD巴 CHAR K X…HEX CODE ]"']EF CODE CHAR ]EF KAN]I CODE @1 @12 @15 KEY TYPE KCODE 7 . 司 f ¥1. ¥ CHAR40 . ; セヱワカ ツイヱレシャ チリイキ ネンレイ ノメキユ ヤユイリ ケスカビ クウリヨカヒ スメメヨカ t こ とカネツカ k イIレリヨカど サコカヒ 1 0 ヨヨ 2 0 ヨヨ 3 0 33 4 0 33 5 0 33 6 0 3ヲ 7 0 ヨヨ *療ネ*** USER DICTIONARY SORT ; BY KEY; PROC SORT DATA A 之江 事業等感**本・ QU マ ‑

94.

SAS KAN]1 EXECUTION 円 b u o H; 市民 (1 UM J+ 1S*‑ PMTJ* 弔問* ztnl m+ 川 本 * nu ︐ 狩 A. 山 o 円N 02 ︒ 155000 50000 20000 20000 40000 30000 255000 80000 40000 40000 80000 50000 135000 25000 15000 20000 45500 50000 205000 45000 25000 20000 30000 45000 355000 95000 34000 34000 87000 75000 215000 45000 30000 45000 50000 54000 235000 80000 31000 34000 72000 67000 145000 45000 25000 23000 34000 75000 104000 30000 15000 24000 35000 42000 t 可 qd 広υQU 詰U 司︐︐令官 UQUQU mmmw ぽ↑ MU M﹀ thL ネ 1E;TmF USM ¥F N O T I EOCNN CNIU 一 ︒ 円 /pm 抗 ︒ OM ST ¥PAO茸 XCV000060000AN ENA232645321SI TIS¥AAAAAAAAAR *pa kd===* EmISECSEEE*C TUNVSDEEREEHEEH*O paOAVRHHSHHSHHS*R '*P ANCSAA ・ Tic A D 100; ; MISC SATIS 訓 説 ︒ KAN]1 CONVERT Nliiid な C 之江 Ta 象 ; PROC PR1NT DATA=TEST; PROC SORT DATA=TEST; BY SEX; ニ コT EST; BY SEX; PROC MEANS DATA コT EST; MODEL CONS DATA 1NCOM PROC GLM PROC CHART DATA TEST; VBAR SEX lSl ゐ1VAR GROUP= AGE; ; ******** PRINT FILE CLOSE 本*本***** PROC PR1NTTO; ******** KAN]1 CONVERT EXECむTE ***本** ; PROC KAN]I UNIT 20 DATA= ニ む DIC ; RむN ; ぷ FACOMの 場 合 変 換 後 の フ ァ イ ル の 出 力 を TSSコマンドで指 プリンターにも日 ますこ、 ディスプレ 、 PROC K L 1STは ?ンドによって、辞書の内 る ζ とによって、 日本語 にも出力する ζ とができる。 録の確認、リストを作成するもので、次のコ ユーザー を日本語及び入力コードについて出力する。 PROC KLIST DATA=UD IC; む D 1C; ユ ー ザ ー 辞 の SASデ ‑98ι タセット名 訓崎

95.

司) PROC PRINT *・***・*・本**** *曲中******本* 男 女 男 160000 290000 155500 165000 325000 224000 284000 202000 146000 一5000 ‑3.226 35000 ‑20500 40000 30000 9000 ‑49000 57000 ‑42000 … 1 3.725 185 15. 19 . 512 8. 451 …4 . 186 ‑20 . 851 ‑39.310 40.385 o PROC CHART 合計の棒グラフ 収入 合計 500000 3 0代 女 男 4 0代 ***ホ **** 女 ‑*・*** **** 2 0代 告や 女 aT 持 必やゆ * * * * ψφ 100000 命令台帳・ 200000 申φ 300000 *場****本 400000 女 5 号 男 5 0代 6 0代 女 性別 年令 同ハ﹀波﹄同円︒岳辻訴湘 30000 50000 50000 45000 75000 54000 67000 75000 42000 貯 蓄 mw¥ 住鑓線以 40000 80000 45500 30000 87000 50000 72000 34000 35000 消 費 足 喪 擦性向 衣料鶴岡 20000 40000 20000 20000 34000 45000 34000 23000 24000 50000 80000 25000 45000 95000 45000 80000 45000 30000 費 ηt d 内 rhunynHvndquA6Qd 光熱費 20000 40000 15000 25000 34000 30000 31000 25000 15000 *** * 療 ・ @ 中 内 155000 255000 135000 205000 355000 215000 235000 145000 104000 雑 ****** ‑m***** 噌 i ru 雪uaa rhupb ヴ4 nむ Q υ 男努女男男女男開力女 20代 3 2 60代 40代 50代 3 2 10 代 食料費 収 入 年令 性 標 本 5 3 cl

96.

③ PROC MEANS 独立変数 N 標準 最小 { 直 偏差 最大 値 標準誤まを (平均〉 =男 独立変数 6666666666 iiMOO‑‑ 収入 食料簡 光熱費 衣料費 住続鐙 雑鰹 満足度 消費 貯蓄 貯蓄性向 ? 、 主 225000β000 3333 65833. 29166.6667 0000 28500. 57166β667 0000 57000. . 3333 6 237666.6667 ‑12666.6667 ‑8 1 .916 平均儀 . 53625 145000β000 355000. 76941 000 31411 . 2506 36835 45000. 21775. 0000 95000.000 8889.7569 20000. 0000 40000. 725028735 000 2959.9174 0000 40000.000 3500.0000 857321410 20000. 30000β000 . 51511 25301 87000θ00 10329. 3003 18275.66688 30000β000 75000β00 7461 . 0098 2β5832 3 . 0000 000 9. 1 . 0853 708481 .9452 160000β000 325000.000 28923.6543 41078.78609 ‑57000β000 40000β00 16770.3442 …3 9.3103 . 11108 21 19 . 512 8 . 6 1 8 6 最小 { 磁 標機 偏葦 最大 儀 様詩集誤差 (平均) 性別 口女 識見躍 消費 貯蓄 貯蓄性期 uqJ ハペunぺ uqu 官 パvnJ 守 U 守 口vnd 雑費 句︑ 収入 食料費 光熱費 衣料費 住居費 3333 151333. 33333.3333 0000 20000. 29666.6667 43500.0000 48666β667 . 3333 5 175166.6667 . 3333 23833 1 9 . 9 1 8 6 57274. 19431 104000β000 215000 . 000 330672715 25000β000 10408.33000 45000. 000 60092521 866025404 0000 30000β00 5000. 15000. 0000 13428B2472 20000β000 . 0000 7753. 4500 1356 7697.40216 35000.0000 50000.000 4444. 0972 54000β00 3527.6684 6110. 10093 420000000 3.51188 2 . 0 0 0 0 9 . 000 2 . 0 2 7 6 42556β2476 146000ρ000 224000β00 245701 .942 16750.62188 42000β000 9000. 000 9670.9761 4 1 .86 55770 18. ‑40.3846 1 0 . 7 1 4 3 , 目 合 ぬ

97.

, @ PROC GLM 一般線形岳帰モデル 従属波数 消費 邑 項目 平方和 29354108582.39116 29354108582 . 39116 7 7177891417 . 60885 1025413059.65841 8 36532000000.00002 モデル 並怨 誤 修正済合計 決係数 0.803518 変動係数 標準偏差 14 .768 1 32022β7145 ド検定め有意~準 0 . 0011 21683333333333 F検定の有意水準 F 1A 28.63 ‑ A n u ハ u n u llHC 戸!i 29354108582.39116 収入 28.63 消費 平方和(タイプ 1) 自由度 瑛協 F f 演 平均平方 一般線形回帰モデル 従属変数 消費 明白 平方和(タイプ 4 ) 叙入 1 29354108582.39116 ノマラメータ 定数項 収入 推定鮪 58448 . 40804674 0.79016870 T値 (帰無仮説母数 0) 1 .86 5 . 35 Ff { 高 l F検去をの有意水準 28.63 0 . 0011 T検定の有意水準 0 . 1056 0 . 0011 (擦準家三島 推定値 31468.15086531 0.14768446