當(dāng)前位置:首頁 > 教育部司局機(jī)構(gòu)

2009年中國(guó)語言生活狀況報(bào)告

一、總貌

2009年的中國(guó)語言生活,呈現(xiàn)出和諧有序、健康穩(wěn)健、生機(jī)勃勃的發(fā)展態(tài)勢(shì)。語言文字工作亮點(diǎn)突出,成效顯著,引起社會(huì)廣泛關(guān)注。民族語文工作多方面開展,新聞出版、廣播電視領(lǐng)域進(jìn)一步加強(qiáng)了對(duì)語言使用的管理,漢語國(guó)際傳播規(guī)模穩(wěn)步擴(kuò)大,海外華文教育迎來難得的發(fā)展機(jī)遇。年度語言熱點(diǎn)不斷涌現(xiàn),語言生活出現(xiàn)新領(lǐng)域和新動(dòng)向。

 

二、領(lǐng)域語言

(一)語言文字工作

語言文字應(yīng)用管理工作不斷拓展 截至2009年年底,城市語言文字工作評(píng)估通過認(rèn)定而達(dá)到標(biāo)準(zhǔn)的二類城市有32個(gè),一二類城市全部達(dá)標(biāo)的省份1個(gè),三類城市88個(gè)。已認(rèn)定的省、市級(jí)語言文字規(guī)范化示范學(xué)校累計(jì)近1.3萬所,教育部、國(guó)家語委認(rèn)定的國(guó)家級(jí)語言文字規(guī)范化示范學(xué)校426所。開展公務(wù)員普通話水平測(cè)試的城市173個(gè),開展窗口行業(yè)普通話測(cè)試的城市達(dá)176個(gè)、219 607人次,參加漢字應(yīng)用水平試點(diǎn)測(cè)試的達(dá)25 577人,參加“中華誦·經(jīng)典誦讀”大賽的超過840余萬人。教育部語言文字應(yīng)用管理司在全國(guó)8個(gè)省(自治區(qū))共舉辦少數(shù)民族教師普通話培班11期,培訓(xùn)教師964。

據(jù)國(guó)家語委組織的全國(guó)16個(gè)城市的外文使用情況調(diào)查數(shù)據(jù)顯示:全國(guó)外文平均使用率達(dá)31%,英語使用占全部外語語種的82.77%。

語言文字信息管理工作深入推進(jìn)  2009發(fā)布了《漢字部首表》《GB13000.1字符集漢字部首歸部規(guī)范》《現(xiàn)代常用字部件及部件名稱規(guī)范》和《現(xiàn)代常用獨(dú)體字規(guī)范》4項(xiàng)國(guó)家語委規(guī)范;以《中國(guó)語言生活綠皮書》的形式,發(fā)布了6項(xiàng)規(guī)范草案。天津市語言文字培訓(xùn)測(cè)試中心受國(guó)家語委委托研制的“漢語口語水平測(cè)試(母語非漢語)標(biāo)準(zhǔn)研究”項(xiàng)目,通過專家鑒定。

教育部、國(guó)家語委發(fā)布了2008年度中國(guó)語言生活狀況報(bào)告。與相關(guān)單位聯(lián)合發(fā)布了“2008年度中國(guó)主流媒體十大流行語”“2009年度中國(guó)主流媒體十大流行語”。國(guó)家語言資源監(jiān)測(cè)與研究中心少數(shù)民族語言分中心的維吾爾語文研究基地和藏語文研究基地分別在西北民族大學(xué)和新疆師范大學(xué)成立。中國(guó)語言資源有聲數(shù)據(jù)庫建設(shè)江蘇省首批試點(diǎn)通過驗(yàn)收,第二批試點(diǎn)工作啟動(dòng);少數(shù)民族語言有聲數(shù)據(jù)庫建設(shè)試點(diǎn)工作在云南啟動(dòng)。中國(guó)語言資源有聲數(shù)據(jù)庫建設(shè)的技術(shù)規(guī)范、工作規(guī)范研制完成。

民族語文工作多方面開展 20097月國(guó)務(wù)院發(fā)布了《國(guó)務(wù)院關(guān)于進(jìn)一步繁榮發(fā)展少數(shù)民族文化事業(yè)的若干意見》,其中四條與少數(shù)民族語言文字工作有關(guān)。在教育部語信司支持下,“全國(guó)彝語術(shù)語標(biāo)準(zhǔn)化工作委員會(huì)”11月在西南民族大學(xué)成立。“藏、維、彝民語語音參數(shù)數(shù)據(jù)庫”“漢藏語系語言詞匯語音數(shù)據(jù)庫”等多項(xiàng)教育部、國(guó)家語委民族語言文字規(guī)范標(biāo)準(zhǔn)建設(shè)及信息化項(xiàng)目結(jié)項(xiàng)。文化部全國(guó)文化信息資源建設(shè)管理中心2009年啟動(dòng)了康巴藏語節(jié)目的譯制工作。

新聞出版語文工作取得實(shí)效 據(jù)2009年的報(bào)告顯示,2008年度全國(guó)教育教學(xué)輔助類報(bào)紙編校質(zhì)量穩(wěn)步上升,全國(guó)行業(yè)報(bào)(部分)編校質(zhì)量普遍提高。

地方語言文字工作 為了迎接2010年上海世界博覽會(huì),上海市語言文字工作委員會(huì)、教育委員會(huì)、質(zhì)量技術(shù)監(jiān)督局于2009年制定了上海地方標(biāo)準(zhǔn)《公共場(chǎng)所英文譯寫規(guī)范》。上海市語委采取多種形式,在全市開展公共場(chǎng)所英文使用規(guī)范化專項(xiàng)整治行動(dòng),取得了階段性成果。2009年,天津市語言文字培訓(xùn)測(cè)試中心受國(guó)家語委委托,在馬來西亞成功舉行了兩場(chǎng)普通話水平測(cè)試,引起了強(qiáng)烈反響。中華經(jīng)典誦讀基地在蘇州建立。朗誦水平等級(jí)考試在上海開展。

(二)廣播電影電視及網(wǎng)絡(luò)語言

廣電總局出臺(tái)嚴(yán)格控制電視劇使用方言的新措施  針對(duì)我國(guó)電視劇大量使用方言的問題,國(guó)家廣播電影電視總局辦公廳20097月下發(fā)了《關(guān)于嚴(yán)格控制電視劇使用方言的通知》。

網(wǎng)絡(luò)語言使用狀況調(diào)查  據(jù)2009年進(jìn)行的一項(xiàng)問卷調(diào)查,經(jīng)常使用網(wǎng)絡(luò)語言的占樣本總數(shù)的31.3%,有時(shí)使用的占50.0%,很少使用的占15.6%,從來不用的占3.1%

(三)語言教育與語言傳播

漢語國(guó)際傳播規(guī)模穩(wěn)步擴(kuò)大  2009年在全球金融危機(jī)背景下,漢語國(guó)際傳播仍穩(wěn)步發(fā)展。截至200912月,在88個(gè)國(guó)家開設(shè)孔子學(xué)院282所、孔子課堂272個(gè),孔子學(xué)院專職兼職教職工約3 100人。中國(guó)向109個(gè)國(guó)家派出教師2 060名,向71個(gè)國(guó)家派出漢語志愿者教師2 740名,向104個(gè)國(guó)家2 500多所主流學(xué)校贈(zèng)送教材、圖書和音像資料315萬冊(cè)。2009年中外雙方對(duì)孔子學(xué)院共投入資金1.19億美元。

海外華文教育的新機(jī)遇  隨著中國(guó)的崛起,華人在國(guó)際上的地位提高,許多國(guó)家政府部門開始理解并支持華文教育。華人社會(huì)捐資助學(xué)、興辦華文教育的熱情空前高漲。2009年國(guó)務(wù)院僑務(wù)辦公室和中國(guó)海外交流協(xié)會(huì),將原來不定期召開的國(guó)際華文教育研討會(huì)改為兩年一屆的世界華文教育大會(huì)。

 

三、新領(lǐng)域和新動(dòng)向

法庭審判中少數(shù)民族語言使用問題 據(jù)內(nèi)蒙古自治區(qū)高級(jí)人民法院統(tǒng)計(jì),該自治區(qū)現(xiàn)有19個(gè)沿邊法院,25個(gè)牧區(qū)法院,轄區(qū)總?cè)丝?SPAN>608.3萬人,占全區(qū)總?cè)丝诘?SPAN>26%,這些法院普遍缺少能夠使用少數(shù)民族語言主持訴訟活動(dòng)的審判人員。全區(qū)現(xiàn)有法官5600多人,蒙漢雙語兼通的法官僅有421人,占全部法官數(shù)的7.5%。雙語兼通的法官數(shù)量遠(yuǎn)遠(yuǎn)不能滿足民族地區(qū)雙語訴訟審判的需要。

語言信息產(chǎn)業(yè)中的喜與憂  喜:機(jī)器翻譯的發(fā)展推動(dòng)了多語言信息服務(wù)產(chǎn)業(yè)的發(fā)展。“面向奧運(yùn)的多語言智能信息服務(wù)網(wǎng)絡(luò)系統(tǒng)”成功為北京奧運(yùn)會(huì)提供了奧運(yùn)信息和城市信息的多語言服務(wù),還將在2010年上海世界博覽會(huì)以及今后各類大型國(guó)際體育文化商業(yè)交流活動(dòng)中提供多語言信息服務(wù)。憂:最近五六年,中國(guó)字庫產(chǎn)業(yè)急劇萎縮,字庫行業(yè)的很多優(yōu)秀人才紛紛改行。究其原因是為盜版所累。

手語使用及相關(guān)問題  在文化、醫(yī)療、社會(huì)保障、體育、商業(yè)、社會(huì)服務(wù)等各個(gè)行業(yè),由于缺乏手語翻譯人員,聽障人士難以與外界進(jìn)行有效溝通。我國(guó)現(xiàn)有的手語翻譯基本都是由聾校老師和殘聯(lián)工作人員兼職承擔(dān),遠(yuǎn)遠(yuǎn)滿足不了2 000多萬聾人的需求。

 

、報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)語言文字使用的若干數(shù)據(jù)

報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)的年度用字用語狀況,可以反映媒體年度的語言使用實(shí)態(tài),也可以透過這些字詞語的使用狀況看到年度的社會(huì)熱點(diǎn)、重大事件等。2009年度的用字用語調(diào)查是在國(guó)家語言資源監(jiān)測(cè)語料庫2009年度的語料上進(jìn)行的,語料涵蓋平面媒體、有聲媒體、網(wǎng)絡(luò)媒體(新聞)三種,共計(jì)1 249 387個(gè)文本文件, 1 007 019 960字次。

今年適逢年度《中國(guó)語言生活狀況報(bào)告》發(fā)布五周年,國(guó)家語言資源監(jiān)測(cè)與研究中心特意對(duì)2005-2009年度的用字用語進(jìn)行了比較。歷時(shí)五年的語料積累,既可以用來反映五年共時(shí)的語言生活,也可以通過對(duì)比分析來反映五年歷時(shí)的語言變化。今年發(fā)布的報(bào)告,對(duì)2005-2009年的字詞語調(diào)查數(shù)據(jù)進(jìn)行了比較,從共時(shí)、歷時(shí)兩個(gè)角度對(duì)五年的字詞語使用狀況進(jìn)行了分析。

(一)漢字使用情況

1. 年度高頻字?jǐn)?shù)量穩(wěn)定,字種數(shù)量有所增加

2009年度語料中共出現(xiàn)10 204個(gè)字種,高頻漢字?jǐn)?shù)量穩(wěn)定,覆蓋率達(dá)到80%、90%、99%的字種數(shù)分別為602、970、2 400個(gè)。

體現(xiàn)2009年度生活的漢字使用頻率有所增加,比如“汶、嬰、杭、飆、碳、迪、拓、旱、悍、蒜”等,在年度用字總表中的排序較往年有較大幅度的前提。

2009年度使用的字種數(shù)量是歷年調(diào)查中最多的。這與當(dāng)年語言生活中的漢字“繁簡(jiǎn)之爭(zhēng)”,“《通用規(guī)范漢字表》(征求意見稿)公開征求意見”,以及網(wǎng)絡(luò)中漢字使用追求標(biāo)新立異有關(guān)。低頻字?jǐn)?shù)量多,漢字總表中覆蓋率達(dá)到99.99%的漢字共計(jì)5336個(gè),若將覆蓋率達(dá)到99.99%之后所有漢字看作低頻字,則2009年度的低頻字占漢字總數(shù)的47.71%。

2009年度用字總表中,包括了繁體字、異體字、不規(guī)范的類推簡(jiǎn)化字、舊計(jì)量單位用字、日本漢字等共計(jì)1804個(gè),占全部年度用字的17.68%。

2. 五年用字總表的高頻字穩(wěn)定,年度特色用字使用頻率變化較大

五年的用字調(diào)查顯示,覆蓋率達(dá)到80%、90%99%的漢字個(gè)數(shù)分別在581602、934971、23142400之間,其占漢字總數(shù)的比例分別沒有超過7.15%、11.49%、28.47%,也就是說每一年不超過用字總量30%的高頻漢字覆蓋了全部語料的99%。因此高頻字的使用數(shù)量相對(duì)穩(wěn)定。同時(shí),每年前3500個(gè)漢字中,有3358個(gè)漢字是相同的,使用的字種也具有穩(wěn)定性。

對(duì)比每一年的用字總表,高頻用字使用頻率變化最大的漢字往往體現(xiàn)了年度的語言生活特點(diǎn),低頻用字使用偶發(fā)性較強(qiáng),多用于專名。

3. 年度用字總表與現(xiàn)行規(guī)范字表之間的差異大于年度字表之間的差異

五個(gè)年度的用字調(diào)查表明,年度用字表前2500字與一級(jí)常用字之間的差異字種數(shù)在342357個(gè)之間,前3500字與《現(xiàn)代漢語常用字表》之間的差異字種數(shù)在388401個(gè)之間,前7000字與《現(xiàn)代漢語通用字表》差異字?jǐn)?shù)在506725個(gè)之間,而每一年度《現(xiàn)代漢語通用字表》中未出現(xiàn)在語料中的漢字個(gè)數(shù)在160244個(gè)之間,有47個(gè)漢字在五年全部字表中均未出現(xiàn)。

比較年度的用字總表與現(xiàn)行規(guī)范字表,媒體語料用字的相同性要大于媒體用字與現(xiàn)行規(guī)范字表之間的相同性。在媒體語料五年都出現(xiàn)的漢字中,有661個(gè)漢字沒有在《現(xiàn)代漢語通用字表》出現(xiàn)。

(二)詞語使用情況

1. 年度詞語使用總體相同性小,高頻詞語的變化體現(xiàn)年度特色

調(diào)查中由分詞軟件對(duì)語料切分得到的總詞語數(shù)共計(jì)592 414 821詞次,詞種數(shù)計(jì)2 348 100個(gè)。其中在報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)三類媒體都出現(xiàn)的詞種數(shù)共計(jì)193 416個(gè)。

覆蓋率達(dá)到90%的高頻詞語共計(jì)12 517個(gè),剔除其中的一些專名、時(shí)間表達(dá)式等,在高頻詞語表中列出了11 635個(gè)詞語。

高頻詞語表的變化體現(xiàn)了年度特色。2009年度,新進(jìn)入到高頻詞語表中的包括“閱兵、世博、假幣、抗旱、哥本哈根、低俗、日全食、貝盧斯科尼、水價(jià)、獻(xiàn)禮”等;與往年高頻詞語相比,2009年度使用頻率變化較大的詞語包括“流感、世博、復(fù)蘇、60年、經(jīng)濟(jì)危機(jī)、全運(yùn)會(huì)、購置稅、奧巴馬、下鄉(xiāng)、回暖”等,這些詞語如實(shí)記錄了2009年度社會(huì)生活。

語料中使用的成語種數(shù)是3 736個(gè),總次數(shù)為1 680 701次,占全部語料總詞次數(shù)的0.28%。成語的詞長(zhǎng)分布在3-8字之間,其中4字詞占全部成語種數(shù)的98.47%。高頻詞語中的成語共有27個(gè),占高頻詞語詞種數(shù)的0.22%。

2.五年詞語比較,總體變化大,高頻詞語使用穩(wěn)定,高頻詞語的微變體現(xiàn)年度特色

2005-2009年度的詞語調(diào)查中,每年的詞種數(shù)在165235萬之間,其中五年都使用的詞種個(gè)數(shù)為330 422個(gè),占全部詞種數(shù)的比例在14%20%之間。三類媒體五年都使用的詞種數(shù)共計(jì)72 641個(gè),占全部詞種數(shù)的比例在3.09%4.4%之間。反映出不同媒體、不同年度詞語使用的共性小,年度詞語使用變化較大。

高頻詞語的使用具有較強(qiáng)的穩(wěn)定性。2005-2009年度覆蓋率達(dá)到90%的高頻詞語穩(wěn)定在12 000個(gè)左右,其中五年都使用的詞種數(shù)共計(jì)9 933個(gè),約占高頻詞語的80%。高頻詞語的用字穩(wěn)定在2 600個(gè)左右,詞長(zhǎng)分布在19字之間,其中詞長(zhǎng)為2字、3字的詞語占全部高頻詞語的80%左右,長(zhǎng)詞多為專名或時(shí)間表達(dá)式。

年度之間高頻詞語的差別體現(xiàn)了年度生活,這些差別體現(xiàn)在詞語使用的頻率變化上,使得一些原本不很高頻的詞語進(jìn)入到高頻范圍,一些原本就在高頻詞語中的詞語排序前提。

3. 流行語

2009年度中國(guó)媒體十大流行語”分8個(gè)常規(guī)類目和5個(gè)特色專題。8個(gè)常規(guī)類目是綜合類、國(guó)際時(shí)政類、國(guó)內(nèi)時(shí)政類、經(jīng)濟(jì)類、科技類、社會(huì)生活類、文化教育類和體育娛樂類;5個(gè)特色專題包括“新中國(guó)成立60周年專題”“兩岸及港澳專題”“環(huán)保專題”“甲型H1N1流感專題”和“社會(huì)問題專題”。

4.新詞語

2009年度語料中共提取出新詞語396條。

就詞語長(zhǎng)度看,具有優(yōu)勢(shì)的依次是三字、二字、四字詞,其中三字詞語占51.01%就詞語構(gòu)成材料看,完全由漢字構(gòu)成的新詞語有390條,占98.48%就結(jié)構(gòu)方式看,有兩點(diǎn)值得注意:一是除傳統(tǒng)的偏正式能產(chǎn)性最高、占總詞數(shù)的53.54%外,后附加式合成詞比例較大,占26.77%;類后綴構(gòu)詞仍以這幾年居高不下的“~門、~族、~客、~奴、~友”等為主;二是2009年新詞語中疊音方式構(gòu)成的詞明顯增多,如“樓歪歪、橋粘粘、墻脆脆”等。就使用頻次分布看,2009年度新詞語出現(xiàn)頻次分布狀況仍是兩頭小、中間大,即特別高頻和特別低頻的詞語都不多。

從社會(huì)語言學(xué)角度進(jìn)行分析,2009年度新詞語有如下三個(gè)明顯特點(diǎn)。一是反映社會(huì)問題的詞語以某些格式為標(biāo)志形成詞語群,如“被××”詞語群、“樓××”詞語群、“執(zhí)法”詞語群等。二是體現(xiàn)“以人為本”理念,反映多元人群的詞語增多。僅以“族、客、友、男、女、派、黨、二代”為標(biāo)記的就有80條,加上其他表人群分類的,共有116條,占新詞語總數(shù)的28.86%。三是網(wǎng)絡(luò)詞語與社會(huì)生活詞語的迅速融合。2009年,所有能夠產(chǎn)生社會(huì)性傳播效果的事件幾乎都源自互聯(lián)網(wǎng)的揭示和推動(dòng),而后迅速被各種傳統(tǒng)媒體引用、傳播,網(wǎng)絡(luò)和傳統(tǒng)媒體相互作用,相互借力,這些詞語甚至成為描述2009年社會(huì)生活的流行語。

 

五、中文博客用字用語專項(xiàng)調(diào)查數(shù)據(jù)

今年,以2009年度的博客語料為基礎(chǔ),專門對(duì)中文博客進(jìn)行了多角度的分析和調(diào)查,調(diào)查內(nèi)容包括博客用戶發(fā)帖情況、博客用字用語情況以及博客標(biāo)簽使用情況。

博客語料采自新浪博客和搜狐博客,包括171 160個(gè)博客用戶全年發(fā)布的共計(jì)12 158 037個(gè)博客帖,平均每個(gè)用戶71個(gè)博客帖,共12 362 687 048字符次,其中漢字9 889 496 758字次。

(一)發(fā)帖量

統(tǒng)計(jì)結(jié)果表明,年發(fā)帖量小于或等于50的用戶占總用戶數(shù)的58.56%,發(fā)帖量小于或等于100的用戶占總用戶數(shù)的84.74%。

(二)機(jī)構(gòu)名、地名、人名使用情況

從機(jī)構(gòu)名類型所分布的情況發(fā)現(xiàn),博客作者關(guān)注更多的是與時(shí)事、政治、軍事等相關(guān)的領(lǐng)域,其次是與傳媒、金融、教育等相關(guān)的話題。

在前50個(gè)高分布率地名中,中國(guó)國(guó)內(nèi)地名34個(gè),國(guó)外地名16個(gè),國(guó)外地名多為國(guó)家名,城市名中僅 “紐約” 1個(gè)。中國(guó)國(guó)內(nèi)地名中,省、自治區(qū)名16個(gè),其中“臺(tái)灣”、“四川”、“廣東”居前三位;城市名16個(gè),“北京”、“上海”居所有城市名的榜首,“香港”名列第三位。

分析前50個(gè)高分布率人名:(1)從國(guó)別上看,國(guó)內(nèi)人名占絕大多數(shù),有39個(gè),國(guó)外人名有11個(gè)。比較國(guó)內(nèi)外人名可以發(fā)現(xiàn):第一、國(guó)內(nèi)沒有經(jīng)濟(jì)界人名進(jìn)入前50個(gè)高分布率人名中,而國(guó)外人名居首的是經(jīng)濟(jì)界名人“巴菲特”,其次才是政治界名人“布什”。第二、國(guó)外沒有影視娛樂界人名進(jìn)入前50,而國(guó)內(nèi)影視娛樂界人名卻占很大優(yōu)勢(shì),共11個(gè)。第三、在11個(gè)國(guó)外人名中,有2個(gè)是宗教人名,國(guó)內(nèi)人名中則為先秦諸子,如“孔子”“孟子”“莊子”等。(2)從人物身份所屬類別上看,居前幾位的都是近現(xiàn)代政治人物,其中“毛澤東”“胡錦濤”“溫家寶”“鄧小平”“蔣介石”“周恩來”6位進(jìn)入了人名前10位。分析類別可以發(fā)現(xiàn),博客作者在人名的關(guān)注上存在一個(gè)傾向,即政治人物>歷史人物>娛樂界人物>文學(xué)界人物>體育界人物。

(三)博客標(biāo)簽調(diào)查

博客標(biāo)簽體現(xiàn)了博客所關(guān)注的主題,博客用戶可以為發(fā)布的每篇日志添加一個(gè)或多個(gè)標(biāo)簽。

出現(xiàn)頻次最高的十個(gè)單字標(biāo)簽是:愛、詩、我、性、夢(mèng)、家、雪、雨、詞、花。

出現(xiàn)頻次最高的十個(gè)雙字標(biāo)簽是:雜談、情感、文化、股票、娛樂、財(cái)經(jīng)、教育、育兒、休閑、健康。

出現(xiàn)頻次最高的十個(gè)三字標(biāo)簽是:互聯(lián)網(wǎng)、小沈陽、情人節(jié)、我記錄、章子怡、毛澤東、劉德華、張柏芝、奧巴馬、鄧玉嬌。

出現(xiàn)頻次最高的十個(gè)四字標(biāo)簽是:生活記錄、感悟隨筆、金融危機(jī)、親情友情、東方神起、人體藝術(shù)、招標(biāo)文件、文學(xué)原創(chuàng)、操作策略、非誠(chéng)勿擾。

 

六、基礎(chǔ)教育階段小學(xué)語文教材漢字使用調(diào)查

調(diào)查涉及8套小學(xué)語文教材。其中中國(guó)大陸6套、中國(guó)臺(tái)灣1套、中國(guó)香港1套。中國(guó)大陸教材中屬新課標(biāo)版的3套,義務(wù)教育版的3套。

調(diào)查采用的是位序調(diào)查法,即統(tǒng)計(jì)首次出現(xiàn)的生字,先按冊(cè)序,次按課文序,再按一篇課文內(nèi)的生字先后排序。8套教材的生字位序之和除以教材總套數(shù),即可得到每個(gè)漢字的位序值。

(一)字量調(diào)查

8套教材共出現(xiàn)不同的漢字字種3855個(gè)。生字出現(xiàn)最多的是人教社的新課標(biāo)版,為2997個(gè);最少的是臺(tái)灣的康軒版,為2328個(gè)。8套教材皆有的生字為1397個(gè),占總生字?jǐn)?shù)的36.24%;只在一套教材中出現(xiàn)的生字有505個(gè),占總生字?jǐn)?shù)的13.1%。顯示各教材生字總量相差不大,但在選取哪些漢字上差異則相當(dāng)大。

只出現(xiàn)在一套教材的有505個(gè)獨(dú)用字,其中28個(gè)屬于《現(xiàn)代漢語常用字表》2500個(gè)“常用字”范圍,有169個(gè)屬于1000個(gè)“次常用字”范圍,296個(gè)在“常用字”和“次常用字”范圍之外。

通過對(duì)總字次、總字種數(shù)、共用、部分共用、獨(dú)用情況的調(diào)查,可以發(fā)現(xiàn)生字教學(xué)用字的兩個(gè)特點(diǎn):(1)每套教材的生字總字種數(shù)相差不大;(2)教材之間的生字字種差異大。

(二)首現(xiàn)生字調(diào)查

一個(gè)漢字首次出現(xiàn)在生字教學(xué)用字中,即為“首現(xiàn)生字”。首現(xiàn)生字的調(diào)查結(jié)果顯示:

1.漢字教學(xué)的高峰集中在第2、34學(xué)期,即小學(xué)一年級(jí)下學(xué)期與二年級(jí)全年。第11、12學(xué)期即六年級(jí),漢字教學(xué)的份量明顯下降。有的是到高年級(jí)沒有再安排生字教學(xué),有的是只有漢字復(fù)現(xiàn)式教學(xué)。

2.第1學(xué)期生字占的份量不算最多,是因?yàn)榈?SPAN>1學(xué)期前半期都安排了拼音教學(xué)。

3.人教新課標(biāo)版的生字教學(xué)字量起伏最大。在第2學(xué)期安排的漢字教學(xué)量明顯高出其他教材。

4.康軒版的首現(xiàn)漢字分布最為平緩。在12個(gè)學(xué)期基本上是均勻地進(jìn)行漢字教學(xué),最少的102字,最多的253字,呈現(xiàn)出中間略微突起、兩端稍稍下傾的平緩延伸線。

1冊(cè)的首現(xiàn)生字,反映的是整個(gè)小學(xué)漢字教學(xué)起始階段學(xué)習(xí)的漢字。8套教材第1冊(cè)的首現(xiàn)生字共有773個(gè),在8套教材都出現(xiàn)的有33個(gè),在7套教材出現(xiàn)的有38個(gè),只在1套教材出現(xiàn)的為299個(gè)。第1冊(cè)共用生字的比例遠(yuǎn)遠(yuǎn)低于整個(gè)小學(xué)階段共用生字的比例,為4.27%36.24%;第1冊(cè)獨(dú)用字的比例遠(yuǎn)遠(yuǎn)高于整個(gè)小學(xué)教材獨(dú)用字的比例,為38.68%13.10%。表現(xiàn)出漢字學(xué)習(xí)初始階段的差異大于整個(gè)小學(xué)階段的生字學(xué)習(xí)差異的特點(diǎn)。

 

七、少數(shù)民族語言(藏語、維吾爾語)用詞狀況調(diào)查

本次調(diào)查涉及藏文及維吾爾文兩個(gè)文種,由國(guó)家語言資源監(jiān)測(cè)與研究中心少數(shù)民族語言分中心(中央民族大學(xué))及藏語文基地(西北民族大學(xué))、維吾爾語文基地(新疆師范大學(xué))共同完成。

(一)小學(xué)藏語文新課標(biāo)教材用詞調(diào)查

本次調(diào)查以青海民族出版社20095月出版的五省(區(qū))藏《語文》實(shí)驗(yàn)教科書為對(duì)象,主要包括課文生詞和課文用詞兩方面調(diào)查內(nèi)容。

1. 課文生詞

課文生詞指課后生詞表中出現(xiàn)的詞。調(diào)查顯示:教材中第112冊(cè)共有2 255個(gè)課文生詞。

調(diào)查結(jié)果顯示,藏語文教材各冊(cè)課文生詞中雙音節(jié)詞均占優(yōu)勢(shì)。將各詞長(zhǎng)按所占比例排序,順序依次為:雙音節(jié)詞、單音節(jié)詞、三音節(jié)詞、四音節(jié)詞。其中單音節(jié)和雙音節(jié)詞共計(jì)2164個(gè),占生詞總數(shù)的95.96%。這體現(xiàn)了基礎(chǔ)教育階段的詞匯學(xué)習(xí)以常用和較簡(jiǎn)單的詞匯為主。

在對(duì)課文生詞在課文中出現(xiàn)的頻次進(jìn)行統(tǒng)計(jì)時(shí)發(fā)現(xiàn):從詞長(zhǎng)1到詞長(zhǎng)4,生詞長(zhǎng)度越長(zhǎng),使用頻次越低。

2. 課文用詞

課文用詞是指在課文中出現(xiàn)的所有詞種。調(diào)查顯示:全部12冊(cè)教材共出現(xiàn)詞種9 224條,詞次總數(shù)97 366。由于動(dòng)詞存在“三時(shí)一式”的形態(tài)變化,前后綴形成的派生詞大量存在,使得課文用詞種數(shù)遠(yuǎn)大于課文生詞種數(shù)。課文詞種數(shù)的分布整體呈上升趨勢(shì),隨著年級(jí)的升高,學(xué)習(xí)的詞種數(shù)逐漸增加,這種循環(huán)漸進(jìn)的教學(xué)模式有利于學(xué)生的學(xué)習(xí)。

調(diào)查項(xiàng)目還包括各課文體裁詞種數(shù)、各冊(cè)詞種數(shù)、詞總數(shù)及各冊(cè)獨(dú)用詞統(tǒng)計(jì)、詞頻統(tǒng)計(jì),以及前500高頻詞調(diào)查等。

本次調(diào)查是我國(guó)首次就少數(shù)民族語言教育教材的使用狀況進(jìn)行調(diào)查,為教材的客觀評(píng)價(jià)提供了定量參考,為藏文量化字詞教學(xué)目標(biāo)的制定提供了依據(jù),也為今后更好地提高藏語文教材的編寫質(zhì)量奠定了一定的基礎(chǔ)。

(二)維吾爾文網(wǎng)站用詞調(diào)查

本次調(diào)查涉及“新疆政府網(wǎng)”、“昆侖網(wǎng)”、“天山網(wǎng)”、“新疆信息網(wǎng)”、“新疆友通電子科技”、“新疆哲學(xué)社會(huì)科學(xué)網(wǎng)”、“教師網(wǎng)”、“莎車教育網(wǎng)”及“維吾爾醫(yī)學(xué)”等9家維吾爾文網(wǎng)站,語料采集的時(shí)間跨度為20064月至200912月,語料內(nèi)容為與大眾日常生活密切相關(guān)的政治、經(jīng)濟(jì)、科學(xué)研究、教育、健康等多個(gè)領(lǐng)域。總語料詞符種數(shù)197 687條、詞符頻次5 473 792、文本數(shù)15 878個(gè)。具體調(diào)查結(jié)果如下:

1. 符號(hào)調(diào)查

本次調(diào)查的維吾爾文符號(hào)包括標(biāo)點(diǎn)、數(shù)字和其他符號(hào)(不含不可顯示的字符、空格符等)。調(diào)查中共出現(xiàn)38種符號(hào),占詞符總數(shù)的0.02%;出現(xiàn)頻次為1 368 520頻次,占詞符總頻次的25.00%。

2. 詞尾調(diào)查

現(xiàn)代維吾爾文的詞形變化豐富,通過綴接不同的詞尾表示詞與詞之間各種不同的語法關(guān)系。如?????(你們)加詞尾-??后,原詞語變成???????(你們認(rèn)為)。本次調(diào)查詞尾頻次總數(shù)為118 848條,詞尾種數(shù)為4 448種,其中頻次超過萬次以上詞尾種數(shù)為32種,如具有雙重功能附加成分的詞尾-??”; 同時(shí)體現(xiàn)一個(gè)以上的語法功能的詞尾-???”等。

3. 詞干調(diào)查

維吾爾語詞干可分為純?cè)~干和去尾詞干。由詞根或詞根綴接詞綴直接形成詞語的詞干稱為純?cè)~干;而將去除詞尾的詞干稱為去尾詞干。這種去尾詞干的存在是由黏著語的特點(diǎn)所決定的。本次調(diào)查對(duì)去尾詞干的統(tǒng)計(jì)是在對(duì)維吾爾語詞的詞形還原后進(jìn)行的,例如:????????(工人的)一詞,去掉詞尾???后的詞干是?????(工人)。本次調(diào)查統(tǒng)計(jì)得到純?cè)~干24 149種,去尾詞干20 111種。然而,純?cè)~干和去尾詞干有部分詞形相同,總詞干是指濾除純?cè)~干和帶尾詞干重疊部分后的所有純?cè)~干和帶尾詞干,統(tǒng)計(jì)得到的總詞干31 452種。

4. 用詞調(diào)查

用詞調(diào)查項(xiàng)目包括詞在語料中出現(xiàn)的頻次、頻率、詞語長(zhǎng)度、文本數(shù)等。在用詞調(diào)查項(xiàng)目中共得到詞種數(shù)197 649條、詞頻410 5267。具體可從以下幾個(gè)方面來分析維吾爾語的網(wǎng)絡(luò)用詞情況:

1)詞語分頻段使用情況:統(tǒng)計(jì)結(jié)果顯示,維吾爾語中的低頻詞種數(shù)量龐大,其中頻次為1的詞占總詞種數(shù)的50.58%,頻次不超過10的詞語占總詞語種數(shù)的86.48%。

2)詞語中首字母與詞種數(shù)分布情況:以 、、、?、、、?、??8個(gè)字母開始的詞種數(shù)量達(dá)萬種以上,以  ??、?、、、 等字母開始的詞種數(shù)量在千條以下,而以其他字母開始的詞種數(shù)量都在2 252條至8 097條之間。

3)詞種使用情況:統(tǒng)計(jì)結(jié)果顯示了維吾爾語用詞相對(duì)集中的特點(diǎn)。詞頻累加覆蓋率為10%時(shí)使用詞種僅27種,占全部用詞種數(shù)的0.02%;而詞頻累加覆蓋率為90%時(shí)的詞種數(shù)量為21 607,僅占全部語料詞種數(shù)的10.93%。

4)高頻詞使用情況:高頻詞指在調(diào)查語料中詞頻累加覆蓋率達(dá)到90%的全部用詞。統(tǒng)計(jì)結(jié)果顯示高頻詞的詞種數(shù)為21 607條,占全部詞種數(shù)的10.93%。

5)詞長(zhǎng)分布情況:詞長(zhǎng)為1-4個(gè)字母的詞只占全部詞種數(shù)的2.55%,占全部詞頻的14.76%,說明在實(shí)際應(yīng)用中,維吾爾文詞長(zhǎng)為1-4個(gè)字母的詞使用較少,日常使用主要以4字母以上詞為主;另一方面,詞長(zhǎng)超過20個(gè)字母的長(zhǎng)詞數(shù)量為812個(gè),僅占全部詞種數(shù)的0.40%,這類詞的使用頻度也很低,僅占全部語料詞頻總數(shù)的0.02%。

6)詞語的文本分布情況:本次調(diào)查的語料文本總數(shù)為15 878篇,其中只在1篇文本中出現(xiàn)的詞種數(shù)為107 144個(gè),占全部詞種數(shù)的54.15%,而出現(xiàn)文本數(shù)小于6篇的用詞占全部詞種數(shù)的81.66%。由此可看出,大多數(shù)詞并非常用詞匯,出現(xiàn)的文本數(shù)量很低,這也體現(xiàn)了維吾爾文網(wǎng)絡(luò)用詞豐富的特點(diǎn)。

調(diào)查還公布了維文網(wǎng)站前1000個(gè)高頻詞干。

 

(《中國(guó)語言生活狀況報(bào)告(2009)》已由商務(wù)印書館出版發(fā)行。)

收藏
(責(zé)任編輯:王朋)

版權(quán)所有:中華人民共和國(guó)教育部 中文域名:教育部.政務(wù)

京ICP備10028400號(hào)-1 京公網(wǎng)安備11010202007625號(hào) 網(wǎng)站標(biāo)識(shí)碼:bm05000001