色噜噜人体337p人体 I 超碰97观看 I 91久久香蕉国产日韩欧美9色 I 色婷婷我要去我去也 I 日本午夜a I 国产av高清怡春院 I 桃色精品 I 91香蕉国产 I 另类小说第一页 I 日操夜夜操 I 久久性色 I 日韩欧在线 I 国产深夜在线观看 I 免费的av I 18在线观看视频 I 他也色在线视频 I 亚洲熟女中文字幕男人总站 I 亚洲国产综合精品中文第一 I 人妻丰满熟av无码区hd I 新黄色网址 I 国产精品真实灌醉女在线播放 I 欧美巨大荫蒂茸毛毛人妖 I 国产一区欧美 I 欧洲亚洲1卡二卡三卡2021 I 国产亚洲欧美在线观看三区 I 97精品无人区乱码在线观看 I 欧美妇人 I 96精品在线视频 I 国产人免费视频在线观看 I 91麻豆国产福利在线观看

實用文檔>現代漢語語法

現代漢語語法

時間:2024-09-06 09:49:27

現代漢語語法

  論文摘要:用計算機來處理漢語信息包括“字處理”、“詞處理”和“句處理”三個階段。“句處理”是實現自然語言的處理與理解這一關鍵性的技術難關。其中遇到的問題比較多:詞性的判斷;短語、句子的結構分析;歧義現象分析等等,最根本的方法是語言學家盡可能地把語言中的這些現象通過歸納、分析、總結出規律,再用形式化的方式描述出來,以便利于計算機處理。 論文

  關鍵詞:中文信息處理 現代漢語語法 句處理

  用計算機來處理漢語信息,就是漢語信息處理,又稱中文信息處理。中文信息處理包括“字處理”、“詞處理”和“句處理”。“字處理”、“詞處理”分別與漢字和詞匯有關,在此主要談談“句處理”。

  句處理的主要內容是,怎樣使計算機理解自然語言(如現代漢語)的句子的意思,又怎樣使計算機生成符合自然語言規則的句子。“句處理”所需要的語言知識,將是一種涉及到語音、語義、語法、語用等諸方面的綜合性知識。目前。大家都深感現有的關于漢語的知識遠遠不能滿足中文句處理的需要。單就句法方面的情況說。在中文信息處理過程中將會不斷遇到我們想象不到的問題,許多問題在人看來還是比較容易解決的,但計算機就解決不了。也有一些問題,本身在學術界就有不同的觀點,那么,就給中文信息處理增加了更大的困難。

  用計算機來處理中文信息,遇到了很多困難,從現代漢語語法的角度來看,主要有以下一些問題:

  一、詞性的判斷

  由于漢語缺乏形態。漢語的詞性判斷主要是根據詞的語法功能,不同的詞,詞性意義可能不同,同一個詞出現在不同的地方,詞性意義也可能不同,漢語中,大多數詞有固定的詞性,但有些詞的用法比較特殊。例如:

  1。他花了十塊錢買了一盆花。

  2。你用那個鎖把門鎖上。

  3。他比雷鋒還雷鋒。

  這三個句子中分別有兩個“花”、“鎖”、“雷鋒”。但它們只是音同、形同,詞性和意義都不同。句子1中的第一個“花”是動詞,“花費”的意思,第二個“花”是名詞,“植物”的意思。句子2中的第一個“鎖”是名詞,即“鎖子”的意思,第二個“鎖”是動詞,是“鎖住”的意思。句子3中第一個“雷鋒”是名詞,表示人名,第二個“雷鋒”是形容詞,表示“雷鋒的精神、品質等”。具有一定語言知識的人大體上都能分清它們的區別。從傳統語言教學的角度來講,句子1中的兩個“花”是詞形、讀音相同,但詞性和意思都不一樣,且兩個“花”的意思之間沒有聯系,所以屬于同音詞。句子2中的兩個“鎖”,也是詞形、讀音相同,詞性和意思都不一樣,但兩個“鎖”意思間有聯系,所以屬于兼類詞。句子3中的兩個“雷鋒”詞形、讀音相同,詞性和意思都不一樣,意思也有聯系,但第二個“雷鋒”屬于詞類活用。Ⅲ從教學的角度看,這種分類比較細致,便于人們的理解和掌握,但是,從中文信息處理的角度來看,這種分法太細,不便于計算機掌握。

  目前,在中文信息處理中,是這樣來定義兼類詞的:亢世勇認為“兼類詞有廣義兼類詞和狹義兼類詞。廣義兼類詞就是中文信息處理中所說的現代漢語的同形詞,對于計算機而言,只要詞形相同,不管讀音是否相同、意義是否相通,是同形異音詞、同形同音詞,還是一詞多義、一詞多種用法,都是相同的,都要從多個當中選一個。狹義的兼類詞就是指一般的現代漢語著作定義的,‘同形同音、意義上有一定的聯系,且具有兩類或兩類以上詞的語法功能的詞”’。陸儉明認為,兼類詞是“指同字形、同音而意義不同或詞性不同的詞”。如果按這種定義理解,以上三個句子中的兩個“花”、“鎖”、“雷鋒”都可以稱之為兼類詞。因為,中文信息處理的目的是讓計算機能根據具體環境判斷出詞的詞性,從而準確理解其中的含義就可以了。盡管如此,但是,漢語詞類是多功能的,一類詞不需要發生詞形變化就可以充當不同的句子成分,不同類的詞可以充當相同的句子成分,這樣就給兼類詞區分帶來了更多的麻煩。因而,兼類詞的選擇是計算機詞性自動標注的一個“瓶頸”。盡管信息處理專家運用了規則排歧、統計概率排歧或者兩者結合起來等多種方法進行排歧,但到目前為止,還沒有一種方法、一種系統能夠徹底解決這個問題。

  二、短語、句子的結構分析

  由于漢語缺乏形態。所以。語序和虛詞成了漢語中表示語法的主要手段。有些短語、句子的結構不好理解,需要形式和意義結合起來分析。例如:

  A組:a。陜西+甘肅+寧夏 (“陜西+甘肅+寧夏”三者為聯合關系)

  b。中國+(北京+陜西)(“中國”與“北京陜西”是偏正關系。“北京”與“陜西”是聯合關系)

  C。中國(陜西(西安))(“中國”與“陜西西安”是偏正關系,“陜西”與“西安”也是偏正關系)這一組中的abe三個短語對人來說,都很容易分清楚,但計算機目前還很難區分,要讓計算機分辨清楚,就得把三個處所名詞組合在一起構成a類、b類、e類不同關系的條件與規則研究清楚,并將這些條件與規則加以形式化輸入到計算機內。

  B組:開始討論(述賓關系)分析研究(聯合關系)研究結束(主謂關系)

  取下來(述補關系) 看完再說(連謂關系) 叫他回來(兼語關系)

  生產管理(定中關系) 諷刺說(狀中關系) 介紹寫(不構成合法的句法關系)

  這組是現代漢語里“動詞性詞語+動詞性詞語”構成的種種不同的結構關系,對人來說,通過講解大致可以分辨,可是讓計算機要分清楚,就非常難,因為我們至今還沒有總結出“動詞性詞語+動詞性詞語”構成各種不同句法關系的具體規則。換句話說,“動詞性詞語+動詞性詞語”在什么條件下一定構成合法的什么句法關系,能構成什么樣不同的句法關系,我們至今還說不清楚。

  C組:天氣好——好天氣(主謂——偏正)很好——好得很(偏正——述補)

  來人了。——人來了。(述賓——主謂)

  一張票三元錢。——三元錢一張票。(主謂——主謂)這一組都是由于語序的不同而形成的結構和意義都不同的短語和句子。這些結構對人而言,稍加學習就可以理解,但這些給計算機理解意思增加了難度。需要人們把這些語序的變化形成的不同的結構概括出規律來,再用形式化的方式描述出來。輸入到計算機里。

  三、歧義現象

  現代漢語短語結構的歧義是進行漢語句法分析的一大障礙。“句處理”要解決的核心問題是排歧問題,計算機面對的歧義,不只是我們人所能感覺到的諸如下面這樣一些句子的歧義現象:

  (1)他正在輸血。(他正給病人輸血。/他病了,正輸血。)

  (2)看望的是病人。(你看望的那個人是病人。/看望你的那個人是病人。)

  (3)我們急需進口產品。(我們急需進口的產品。/我們急需從國外進口產品。)

  某些在人看來不存在歧義的句子計算機會認為有歧義。例如:

  (4)a他被警察叫去罰了一百塊錢。

  b他被警察叫去寫了一份檢查。例(4)a句和b句,在人的眼里結構是不一樣的。a句“被警察”這個介詞結構一直管到底。全句意思是“他被警察叫去,他被警察罰了一百塊錢”:而b句“被警察”這個介詞結構只 管到“叫去”,管不著“寫了一份檢查”。可是,計算機分辨不清楚。要讓計算機分辨清楚,我們就得將“PP+VPI+VP2”(PP代表介詞結構,VP1和VP2分別代表緊挨著的不同的動詞性詞語)這種結構中的PP對后面動詞性詞語管轄的范圍及其條件與規則進行充分、準確的描寫,并加以形式化,“交給”計算機。而這一類現象與規則我們過去根本就沒有考慮過,更不用說研究了。

  其實以上所舉的例子都存在歧義問題,因此,也可以這么說,“句處理”要解決的核心問題是排歧問題。

  中文信息“句處理”的研究工作,上個世紀80年代就開始了,最早進行“句處理”研究工作就是基于規則展開的,但上個世紀90年代初,基于規則的“句處理”研究工作遇到了重重困難與難關,主要是語言學家所提供的語言規則遠遠不能滿足信息處理的需要。目前,為了解決好中文信息處理中的“句處理”難題,出現了一個競相研究、競相發展的局面。對于句處理,提出的各種策略和途徑,歸納起來。主要有基于規則和基于統計這兩種策略。基于規則的研究者,一般求諸專家的理性知識,由人來對語言知識進行抽象:基于統計者,一般求助于計算機對大規模語料庫真實文本的統計分析,由計算機來抽象出語言知識。各種策略和途徑,目前,我們還很難說哪一種是唯一正確的。各種策略和途徑,表面看不同,其實,最終都需要依賴可靠的漢語知識來驅動計算機正確處理自然語言(漢語)。因此,“無論是比較傳統的基于規則的處理策略,還是90年代以來方興未艾的基于統計的方法,在對語言知識的需求這一點上實際上都是共同的。所不同者,走規則路線的研究者一般求諸專家的理性知識,由人來對語言知識進行抽象(比如以帶有合一條件的規則形式給出)。而走統計路線的研究者一般求助于計算機對大規模的語料庫的統計分析,由計算機來抽象出語言知識(比如以一定的數據結構記錄的統計結果等)。兩種路線孰優孰劣,不能籠統判斷,只能跟具體的應用目標結合起來,由實踐結果來評價。”目前,越來越多的學者提倡把兩種方法結合起來使用。因此,相信在不久的將來,我們會攻克難關,實現計算機對自然語言的處理與理解的目標,使中文信息處理技術處于世界領先地位。

  參考文獻:

  1。蘭賓漢、邢向東:現代漢語(下冊)[M]。北京:中華書局,20xx,48。

  2。亢世勇:面向信息處理的現代漢語語法研究[M]。上海:上海辭書出版社,20xx,177。

  3。陸儉明:現代漢語語法研究教程(第三版),[M]。北京:北京大學出版社。20xx年,51。

  4。詹衛東:面向中文信息處理的現代漢語短語結構規則研究[M]。北京:清華大學出版社,20xx,2。

【現代漢語語法】相關文章:

名詞性從句語法總結歸納02-14

用戶協議
主站蜘蛛池模板: 一本久久道 | 国产精品免费一区二区三区都可以 | 在线看黄免费 | 日韩最新网址 | 在线看免费无码av天堂 | 8x国产一区二区三区精品推荐 | 无码av中文字幕一区二区三区 | 国产又粗又猛又黄又爽的视频 | 久久特黄视频 | 国产精品播放 | 国产女主播精品大秀系列 | 美女少妇翘臀啪啪呻吟网站 | 中文字幕丰满乱子无码视频 | 情人伊人久久综合亚洲 | 国产国拍亚洲精品永久软件 | 一本一道久久a久久综合蜜桃 | 亚洲性久久久影院 | www亚洲天堂| 97色资源 | 2021久久超碰国产精品最新 | 亚洲 自拍 另类小说综合图区 | 免费无码av片在线观看动漫 | 亚洲一区二区二区久久成人婷婷 | 无码人妻一区二区无费 | 欧美成人免费在线观看视频 | 国产极品粉嫩馒头一线天av | 日本免费人成视频播放 | 欧美蜜桃网 | 少妇又紧又深又湿又爽黄总 | 国产精品久久久久久久久久嫩草 | 国产尤物精品自在拍视频首页 | 亚洲午夜无码久久久久软件 | 欧美性爽爽 | 99热国产在线手机精品 | 久久精品视频9 | 少妇做爰又色又紧夜视频 | 日本a免费| 春闺艳妇(h)高h产乳 | 亚洲一卡二卡三卡四卡 | 黄色真人毛片 | 国产粉嫩尤物极品99综合精品 | 中文天堂 | 天天躁日日躁狠躁欧美 | 高潮毛片无遮挡免费 | 精国产品一区二区三区四季综 | 国产在线精品一区二区在线看 | 亚洲人精品午夜射精日韩 | 精品无码久久久久国产app | 亚洲乱码一卡二卡卡3卡4卡 | 幸福宝污| 国产精品久久毛片 | 国产黑丝在线播放 | 毛耸耸性xxxx毛耸耸 | 一少妇挑战三个黑人内谢 | 日日摸日日碰 | 欧美精品一国产成人综合久久 | 在线激情视频 | 久久国产av影片 | 日本黄色www | 国产精品色一区二区三区 | 玩超薄丝袜人妻的经历 | 狠狠色噜噜狠狠狠狠综合久 | 亚洲色欲色欲www在线看小说 | 日产精品高潮呻吟av久久 | www国产免费 | 97在线视频免费 | 欧美狂野激情性xxxx在线观 | 日韩一区二区三区在线观看视频 | 亚洲熟妇av一区二区三区宅男 | 亚洲成av 人片在线观看无码 | 国产欧美日韩视频怡春院 | 性欧美熟妇视频免费观看 | 一区二区三区四区在线播放 | 成人性色生活片 | 午夜福利一区二区三区高清视频 | 午夜快播 | 久久伊人免费 | 免费无码又爽又刺激软件下载直播 | 久久日本片精品aaaaa国产 | 精品视频成人 | 一级片免费 | 欧美一级片在线免费观看 | 国内揄拍国内精品少妇 | 国产又黄又猛又粗又爽的a片动漫 | 国产做a爰片久久毛片a片 | 日韩三级黄色毛片 | 久久精品re | 九色视频自拍 | www.伊人.com| 国产成a人亚洲精品无码久久网 | 亚洲精品福利在线 | 无码精品黑人一区二区三区 | 亚洲制服丝中文字幕 | 国产精品国语对白露脸在线播放 | www.一区二区三区在线 | 中国 | 欧美变态另类xxxx | 日韩精品 在线 国产 丝袜 | 久久人人97超碰爱香蕉 | 日韩激情毛片 |