259 Views
November 17, 21
スライド概要
2007年度の京都大学文学部情報技術演習の講義のために作成したスライドです。
Independent Developer
情報技術演習 第8回 「情報の意図と行為」 2007/11/27 久保田秀和 文学部/情報学研究科 [email protected] http://www.ii.ist.i.kyoto-u.ac.jp/~kubota/
Webインタラクションを支える技術 • 情報の構造化と形式化 • • • HTML(→第2回・基礎編) XML(RSS等)(→第7回・応用編) Wiki, microformats(→第8回) • インタラクション技術 • Ajax(→第3回) • Asynchronous javascript + XML • 自然言語処理基礎(→第4回) • 情報基盤(→第5回) • 情報の意図と行為(→第8回) • • 行為としてのタグ付け(メタ情報) 行為としてのリンク ⇒ 集合知,PageRank 矢印 は「表現」あるいは 「行為」のやりとり →第9回,第10回ではWebの未来へ
形式化の効用とコストのトレードオフ (前半シリーズの復習) • 情報化社会において計算機による支援を受けるためには,情 報を妥当な範囲で形式化する必要がある – HTML, XML, SemanticWeb等が提唱された際にも,必ず形式化の効 用とコストのトレードオフにおける妥当さが,それぞれの事情において検 討されてきた • トレードオフ – 効用 • 計算機処理の容易さ • 共有のしやすさ – コスト • 人が形式的に記述するための労力 • とくに集団の場合,形式を決定するまでにかかる時間 • HTML,XML,SemanticWeb,より緩やかな形式も状況に応じ て利用されつつある
(1) Not HTML • HTMLより緩い形式 – よりプレーンテキストに近い • Wiki記法 - プラットフォームの仕様に依存しない,「どこでもリソース が利用可能」(Bo Leuf and Ward Cunningham, “Wiki Way” より) • Webで読むことを前提としない場合 – ソースコードへの注釈など – 簡素な記法 • HTMLが高価と思われる場合 – 情報共有を主眼とするシステム,文章中心の日記 • 各種Wikiクローン,Blogシステム,文書整形システム で採用 – 適用領域に独特の,簡素化された記法が定められている
Wiki • WikiWikiWeb (Ward Cunningham, 1994) – 「できる限りの効果を発揮しうる,最も単純なオンラ インデータベース」 • 自由に拡張可能な,連結されたウェブ「ページ」の集積で ,情報を格納し,修正するためのハイパーリンクシステム • 入力形態としてウェブブラウザ・クライアントを使うことで, 各ページが誰にでも容易に編集可能となるデータベース (以上,”Wiki Way” より) – 生まれたばかりのWebを前提として,「開放的な編 集」手法の実現に着目 – 多数のWikiクローン
練習:Wikiで文書を編集する(10分) • FreeStyleWiki – Wikiクローンの一つ – http://fswiki.poi.jp/wiki.cgi • 練習用ページ – http://cresta.kuis.kyoto-u.ac.jp/cgi-bin/fswiki/wiki.cgi – itp – 用意したトピックについて,ページを作ってください
軽量マークアップ言語 Lightweight markup language • HTMLやXMLよりも,人間にとって扱い易く設計された マークアップ言語 – 単純で入力しやすく,文書構造を示す直感的な見た目を持 つことが多い • reStructuredText – http://docutils.sourceforge.net/rst.html – 元はPythonソースコード内に注釈を記述するために開発 • WYSIWYG (what-you-see-is-what-you-get) に近い発想 • It is useful for in-line program documentation. • Webでの表示を目的としない文章内に注釈を書く場合,HTMLで書 いてしまうと人にとって読みにくい – 再利用性も確保 • HTMLへ変換して表示することも可能
練習:軽量マークアップ言語 • HTMLへの変換をオンラインで試してみる – http://www.hosting4u.cz/jbar/rest/rest.html – 記法のリファレンス • http://docutils.sourceforge.net/docs/user/rst/quickref.html Chapter 1 Title =============== Section 1.1 Title ----------------- Subsection 1.1.1 Title ~~~~~~~~~~~~~~~~~~~~~~ Section 1.2 Title ----------------Chapter 2 Title =============== (http://docutils.sourceforge.net/docs/u ser/rst/quickstart.html より) Chapter 1 Title Section 1.1 Title Subsection 1.1.1 Title Section 1.2 Title Chapter 2 Title
記法の独自性 • 記法は適用領域に特化されている – Wikiクローン毎に細かい記法が異なる – 各種ブログシステム毎の記法 • はてな記法 – http://hatenadiary.g.hatena.ne.jp/keyword/%E3%81%AF%E3%81 %A6%E3%81%AA%E8%A8%98%E6%B3%95%E4%B8%80%E8 %A6%A7 • hnf (Hyper NIKKI Systemのための記法) – http://www.h14m.org/docs/hnf-j.html • その他,blosxom, Nucleus, tDiary等それぞれ独自の簡 素な記法を持つ
(2) Not XML • シリアライゼーション用の言語としては,XMLよりも軽 量な言語も利用されつつある – シリアライゼーション・・・ソフトウェアの内部データを交換や 保存のための形式へ変換すること – 素朴なデータ形式の場合,XMLを用いてシリアライズするこ とは割に合わない • データ量 • 実装コスト • 人にとっての読みやすさ • JSON(JavaScript Object Notation) – http://www.json.org/ • YAML (YAML Ain‘t Markup Language) – http://www.yaml.org/
YAML • YAML http://www.yaml.org/ – YAML documents are very readable by humans. – YAML is easy to implement. • インデント,ダッシュ,コロンな ど,データ構造を示す直感的 な見た目を持つ 請求書の例(http://www.yaml.org/start.html)
(3) Not Semantic Web
• Microformats (http://microformats.org/)
– 意味づけが行われる際の既存のパターンを標準化
• (X)HTML要素中のclass属性は,要素の意味を緩やかに示すよう
に記述されていることが多い (演習第3回参照)
• そうした習慣的なclass属性の付け方を互いに申し合わせることに
よって,classをメタ情報として活用する
– RDFを用いるよりも記述が簡素
h1.introduction{color:navy;font-size:120%;}
h1.theme{color:crimson;font-size:120%;}
<h1 class=“introduction”>情報技術演習2007について</h1>
…
<h1 class=“theme”>インターネット広告</h1>
…
<h1 class=“theme”>ブログ</h1>
…
<h1 class=“theme”> ゲームから見る3Dグラフィックス</h1>
Microformats • Humans first and machines second • オントロジーを重視するSemantic Webよりも緩い,申し合わ せ(conventions) • 特定の問題領域ごとに定める • 定義 (http://microformats.org/wiki/Main_Page#Definition) simple conventions for embedding semantic markup for a specific problem domain in human-readable (X)HTML/XML documents, Atom/RSS feeds, and "plain" XML that normalize existing content usage patterns using brief, descriptive class names often based on existing interoperable standards to enable decentralized development of resources, tools, and services
Microformatsの例(1)
• hReview
http://microformats.org/wiki/hreview
– 製品,サービス,ビジネス,イベントのレビューを文
書((X)HTML, RSSなど)へ埋め込むための形式
<div class="hreview">
<p><div class="blogimg"><a class="item url" href="http://www.eigaseikatu.com/title/3310/"><img
src="http://www.eigaseikatu.com/title/blogimg.php?no=3310" style="border: none;" alt="ナイトメアー・
ビフォア・クリスマス" class="photo" /></a></div></p>
<p><a class="item url" href="http://www.eigaseikatu.com/title/3310/"><span class="fn">ナイトメ
アー・ビフォア・クリスマス</span></a></p>
<p>★★★★☆ [<abbr class="rating" title=“9">90点</abbr>](<abbr class="worst"
title="0">0</abbr>-<abbr class="best" title="10">100点</abbr>)</p>
<p class=“description”>ジャックがかわいい!
</p>
<p><span class="reviewer vcard">Posted by <a class="url fn" href="http://cresta.kuis.kyotou.ac.jp/positlog/itp.html">久保田秀和</a> on <abbr class="dtreviewed" title="2006-1114T07:12:15+09:00">2006/11/14</abbr></span> with <span class="eigaseikatu-powered"><a
class="url" href="http://www.eigaseikatu.com/">映画生活</a></span></p></div>
「映画生活」サイトで制作したhReview形式の映画レビュー
http://www.eigaseikatu.com/title/hreview.html
Microformatsの例(2) • XFN (XHTML Friends Network) – http://gmpg.org/xfn/ – 人間関係をハイパーリンク中に表現 – <a href="http://www.ii.ist.i.kyoto-u.ac.jp/~xxx/" rel="friend met colleague">... – FOAFと比較すること(演習第7回参照)
まとめ:人間寄りの形式化 • Wiki記法,軽量マークアップ言語,Microformats な ど – 人間にとって読みやすい,書きやすい – 実装や問題領域に寄り添った素朴な形式化 • 必要に応じて変換プログラムを制作し,(X)HTML,XML,RDF等の 広く共有可能な形式と互換させる
Webインタラクションを支える技術 • 情報の構造化と形式化 • • • HTML(→第2回・基礎編) XML(RSS等)(→第7回・応用編) Wiki, microformats(→第8回) • インタラクション技術 • Ajax(→第3回) • Asynchronous javascript + XML • 自然言語処理基礎(→第4回) • 情報基盤(→第5回) • 情報の意図と行為(→第8回) • • 行為としてのタグ付け(メタ情報) 行為としてのリンク ⇒ 集合知,PageRank 矢印 は「表現」あるいは 「行為」のやりとり →第9回,第10回ではWebの未来へ
メタ情報(アノテーション) • 情報それ自身について記述する情報 – より抽象化された情報(≒意味) • 具体的な,詳細度の高い情報を計算機にとって理解し やすいものとするために利用される • 写真における例 – 撮影日時,緯度経度,機種,露出時間 – タグ(flickr参照) – 具体的な注釈を指すことも
メタ情報の例 • 構造化されたメタ情報 – MPEG-7 • 映像などマルチメディアコンテンツのメタ情報 – RSS • ウェブサイトのメタ情報(前回講義) – FOAF(Friend of a Friend) • 人間関係のメタ情報(前回講義) • フラットなメタ情報 – フォークソノミーにおけるタグ • コンテンツ(記事,画像,映像)のメタ情報
フォークソノミー(folksonomy) • folks(人々)+taxonomy(分類学) • 階層や一定の意味が定義されない • 人々の明示的,暗黙的な意図が流動的に集約される
行為としてのタグ(1) • タグを付けるときの意図は様々 – 自分の整理のための分類 • 健康,生活,スポーツ – 相手に探し出してもらうための手がかり • iPod touch,久保田秀和 – 誰かあるいは自分へ向けたメッセージ • これはすごい • あとで読む,あとで考える • いい話 – 同じタグだからといって同じ意図のもとに付けられ たとは限らない
行為としてのタグ(2) • しかし,人がわざわざタグを付けたという行為 そのものが,意図まで判らなくとも,情報の重 要度を測る上でそこそこの指標となる • 計算機は行為の回数だけ数え上げて,その行 為に意味づけする部分は読み手の判断に委 ねている – 前回講義のSemantic Webの原理と比較してくだ さい
練習:タグをつける(5分) • PositLogの機能を用いて,自分のレポートのス プライトにタグをつけてください – ひとつのスプライトには複数のタグをつけることが できます – タグはスペースで区切ってください
タグをつける,集計する • タグは自動的に集計され,タグクラウドと呼ばれる手 法で可視化されています. • スプライトにつけられたタグのリンクは rel-tag と呼ば れるmicroformatsを用いて,タグであることが示され ています – <a href="./tag/%E4%BD%BF%E3%81%84%E6%96%B9" rel="tag">使い方</a>
行為としてのリンク • ページからページへリンクを張ることも人の行 為である • リンクを張るときの意図も様々である – 言及先を示す(誤りを指摘することも),関連情報 を示す,出典を示す,仲良くなりたい,愛してる! – しかし,意図が判らなくとも,リンクのトポロジーは 情報の重要度を測る上でそこそこの指標となる ⇒PageRankアルゴリズム
PageRank • Googleによる解説 – http://www.google.co.jp/intl/ja/why_use.html – “ぺージAからページBへのリンクをページAによるページB への支持投票とみなし、Googleはこの投票数によりそのペ ージの重要性を判断” – “「重要度」の高いページによって投じられた票はより高く評 価されて、それを受け取ったページを「重要なもの」に”
PageRank(2) • PageRank補足ページ参照 – http://cresta.kuis.kyoto-u.ac.jp/positlog/positlog.cgi?load=071127Ut (要ログイン) • Rankの伝搬 – あるページの Rank を,ページ内のforward link(ページから出てゆくリ ンク)の数で割った値を,リンク先のRankに加算 – Figure2はもっとも単純化された例であるため,初期値に対して算数で Rankを求めることが出来る – Figure3のように伝搬が循環する場合,基礎的な線形代数の知識が必 要 • こちらに丁寧な解説があります http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html • PageRankのWebへの適用 – ループや孤立したページ群への対処 – 計算コスト
(来週の予告)グループウェアの設計と行為 • The Coordinator(1986) – Winograd • 対話システム,グループウェアの研究の先陣 • Larry Page(Google創業者)の指導教員,でもある – 会話のやりとりにおける行為を計算機に理解させ るには?
課題 • タグの利用について調査し,タグを付ける際の 意図のあり方やタグ付けの結果観察される現 象について論じてください • およそA4・1ページ以上の分量を期待します. • PositLogの自分のページにまとめて,URLを 久保田( [email protected] )へメー ルしてください. • 期限は12月1日(土)17:00