[論文紹介@SNLP2023] Unsupervised Discontinuous Constituency Parsing with Mildly Context-Sensitive Grammars (ACL2023)


PhD student at the University of Tokyo, Japan



論文紹介 Unsupervised Discontinuous Constituency Parsing with Mildly Context-Sensitive Grammars Songlin Yang, Roger Levy, Yoon Kim ACL 2023 上田 亮 (東京大学 宮尾研究室 D1) 2023/08/28 (月) 第 15 回最先端 NLP 勉強会 (SNLP 2023)


目次 1. 論文の概要 2. 背景 (動的計画法側から) 3. 背景 (統語理論側から) 4. 教師なし LCFRS 5. 実験結果など 6. まとめ 1




論文の概要 1/2 Unsupervised Discontinuous Constituency Parsing with Mildly Context-Sensitive Grammars :::::::::::::::::::::: ::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::: 不連続 な (; 非交差制約を満たさない) 句構造をもつ 弱文脈依存文法 の 教師なし学習 ::::::::::: :::::::::::::::::::::::: :::::::::::::::::::: 今回活躍する文法は CCG でも TAG でもなく LCFRS (Linear Context-Free Rewriting System) ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: (知名度の低い formalism 故に mildly context-sensitive grammar と言ってウケの良さを狙ったのかなと邪推) 2


論文の概要 2/2 動的計画法側の進展 因子グラフ文法 (FGG) 文法 as 因子グラフ HMM, PCFG の一般化 低ランク FGG パラメタ数削減で 計算の効率化 統語理論側の進展 LCFRS CFG/TAG 等の共通部分 を上手く抽出 教師あり LCFRS 不連続な句構造の Parsing に向いている 教師なしLCFRSの実現へ ::::::::::::::::::::::::::::::::::::::::::: 3


背景 (動的計画法側から)


Factor Graph Grammar (FGG) [Chiang and Riley, 2020] Factor Graph Grammar (FGG) [Chiang and Riley, 2020] 統語構造 as 因子グラフ (Factor Graph) HMM/PCFG の一般化 信念伝搬 (メッセージ・パッシング) は 前向き/内側アルゴリズムの一般化 (賢い より広範な文法の Parsing 実装しやすく ) 画像は [Yang et al., 2022] より拝借 4


PCFGs can do better [Yang et al., 2021] Unsupervised PCFG with Many Symbols PCFG を低ランクなテンソルで効率化した分 非終端記号の数を多くしてみた話 P T = ri=1 ui ⊗ vi ⊗ wi (ui , vi , wi ∈ RN ) DIORA [Drozdov et al., 2019] や PRPN [Shen et al., 2018] を凌ぐ ※両者とも (当時)SoTA の教師なし構文解析 大量の非終端記号さえあれば PCFG でよい? 隠れ層の大きな CNN 的なもの? 事後分布が複雑になるのかな? 5


低ランク FGG [Yang et al., 2022] FGG 文法 as 因子グラフ (前々頁) Many Nonterminals 低ランク化して効率化 (前頁) 低ランク FGG [Yang et al., 2022] 因子 (Factor) as 低ランクなテンソル 前頁よりもさらに効率的なアルゴリズム が得られる さらに効率的な信念伝搬が可能になる 性能も良好 6


背景 (統語理論側から)


Linear Context-Free Rewriting System 筋の良さげな統語理論あるある [Vijay-Shanker et al., 1987] 木 (Tree) から木 (Tree) への 書換 (Rewriting) として定式化されがち :::::::::::::: 線形 (Linear) :::::::::: • 一回の書換で木のサイズがおおよそ線形に増加 • ※小さくならない & 倍々ゲームみたいに増えるわけでもない 文脈自由 (Context-Free) (※導出過程が) :::::::::::::::::::: • 導出過程が過去の書換履歴に依存しない • ※導出過程が文脈自由なのであって 言語が文脈自由とは限らない Linear Context-Free Rewriting System (LCFRS) として抽象化・定式化 (賢い ) ::::::::: 7


Simple Range Concatenation Grammar Simple Range Concatenation Grammar (SRCG) LCFRS と等価 & LCFRS の記述に便利 [Boullier, 1998] LCFRS G = (N, T, V, P, S), where N : a set of nonterminals T : a set of terminals V : a set of variables S ∈ N : a start symbol P 3 A(α1 , . . . , αdim(A) ) → (1) (1) (m) (m) A1 (X1 , .., Xdim(A1 ) ) · · · Am (X1 , .., Xdim(A1 ) ) ::::::: ::::::::::::::::: 8


LCFRS では不連続な句構造を表現できる 自然言語にしばしば見られる不連続な句構造 Wh-movement (英語), V2 語順 (ドイツ語), Cross-serial dependency (オランダ語), etc. LCFRS では不連続な句構造を表現できる 画像は [Yang et al., 2023] より拝借 9


教師あり LCFRS 教師あり LCFRS たまに revisit され 不連続な句構造を表現する手法 としての有用性が確認されてきた模様 [e.g., Maier et al., 2012, Coavoux and Cohen, 2019, Stanojević and Steedman, 2020b] (話が逸れますが) Stanojević & Steedman のバイタリティがすごい Incremental CCG と並行してこんなこともしてたんですね [Incremental CCG: Stanojević and Steedman, 2019, 2020a] 10


教師なし LCFRS


教師あり LCFRS から教師なし LCFRS へ 動的計画法側の進展 因子グラフ文法 (FGG) 文法 as 因子グラフ HMM, PCFG の一般化 低ランク FGG パラメタ数削減で 計算の効率化 統語理論側の進展 LCFRS CFG/TAG 等の共通部分 を上手く抽出 教師あり LCFRS 不連続な句構造の Parsing に向いている 教師なしLCFRSの実現へ ::::::::::::::::::::::::::::::::::::::::::: ※厳密には LCFRS を少し制限した LCFRS-2 11




定性評価 (を 1 つ紹介) 画像は [Yang et al., 2023] より拝借 12


定量評価 (を 1 つ紹介) • NEGRA, TIGER ドイツ語ツリーバンク • LASSY オランダ語ツリーバンク 画像は [Yang et al., 2023] より拝借 13




主著者 (Songlin Yang さん) がすごい 主著のリスト (御本人の HP をもとに作成): • • • • • • • • ACL 2023 × 2 EMNLP 2022 (findings) NAACL 2022 (*equal contribution) ACL 2022 × 2 ACL 2022 (findings) ACL 2021 NAACL 2021 COLING 2020 (タイトルを見る限り) 全て Parsing 関連の論文 めちゃくちゃカッコいい 14


まとめ 動的計画法側の進展 Factor Graph Grammar 低ランク FGG 統語理論側の進展 Linear Context-Free Rewriting System 教師なしLCFRSの実現へ ::::::::::::::::::::::::::::::::::::::::::: Parsing は複雑性と効率性のせめぎ合い • Continous vs. Discontinuous • Many Parameters vs. Many Nonterminals 両者のギリギリの境界線が分かりつつある? GPU の登場によって盤面が変化? 15


