亚洲综合原千岁中文字幕_国产精品99久久久久久久vr_无码人妻aⅴ一区二区三区浪潮_成人h动漫精品一区二区三

主頁 > 知識庫 > Python自然語言處理之切分算法詳解

Python自然語言處理之切分算法詳解

熱門標簽:地圖標注微信發送位置不顯示 315電話機器人廣告 地圖標注的意義點 蓋州市地圖標注 房產電銷外呼系統 南京銷售外呼系統軟件 地圖制圖標注位置改變是移位嗎 浙江電銷卡外呼系統好用嗎 上海機器人外呼系統哪家好

一、前言

我們需要分析某句話,就必須檢測該條語句中的詞語。

一般來說,一句話肯定包含多個詞語,它們互相重疊,具體輸出哪一個由自然語言的切分算法決定。常用的切分算法有完全切分、正向最長匹配、逆向最長匹配以及雙向最長匹配。

本篇博文將一一介紹這些常用的切分算法。

二、完全切分

完全切分是指,找出一段文本中的所有單詞。

不考慮效率的話,完全切分算法其實非常簡單。只要遍歷文本中的連續序列,查詢該序列是否在詞典中即可。上一篇我們獲取了詞典的所有詞語dic,這里我們直接用代碼遍歷某段文本,完全切分出所有的詞語。代碼如下:

from pyhanlp import *


def load_dictionary():
    IOUtil = JClass('com.hankcs.hanlp.corpus.io.IOUtil')
    path = HanLP.Config.CoreDictionaryPath.replace('.txt', '.mini.txt')
    dic = IOUtil.loadDictionary([path])
    return set(dic.keySet())


def fully_segment(text, dic):
    list = []
    for i in range(len(text)):
        for j in range(i + 1, len(text) + 1):
            temp = text[i:j]
            if temp in dic:
                list.append(temp)
    return list


if __name__ == "__main__":
    dic = load_dictionary()
    print(fully_segment("在絕對實力面前,一切的說辭都是枉然", dic))

可以看到,完全切分算法輸出了文本中所有的單字與詞匯。
這里的算法原理是:開始遍歷單個字,以該字為首,將后面每個字依次組合到單個字中,分析出這些組合字句是否在詞典中。第二次,從第二個字開始,組合后面的字,以此類推。不懂的看下圖就明白了。

三、正向最長匹配

雖然說完全切分能獲取到所有出現在字典中的單詞,單字,但是我們獲取語句中單字一般來說沒有任何意義,我們更希望獲取的是中文分詞,那種具有意義的詞語序列。

比如,上面我們希望“絕對實力”成為一整個詞,而不是“絕對”+“實力”之類的碎片。為了達到這個目的,我們需要完善一下我們的算法??紤]到越長的單詞表達的意義更加的豐富,于是我們定義單詞越長優先級越高。

具體來說,就是在某個下標為起點遞增查詞的過程中,優先輸出更長的單詞,這種規則被稱為最長匹配算法。該下標的掃描順序如果從前往后,則稱為正向最長匹配,反之則為逆向最長匹配。

下面,我們來實現正向最長匹配,代碼如下:

def forward_segment(text, dic):
    list = []
    i = 0
    while i  len(text):
        long_word = text[i]
        for j in range(i + 1, len(text) + 1):
            word = text[i:j]
            if word in dic:
                if len(word) > len(long_word):
                    long_word = word
        list.append(long_word)
        i += len(long_word)
    return list

算法的原理:首先通過while循環判斷i是否超出了字符串的大小,如果沒有,獲取當前第一個字符串為第一個最長匹配結果,接著遍歷第一個字符串的所有可能組合結尾,如果在字典中,判斷當前詞語是否大于前面的最長匹配結果,如果是替換掉最長。遍歷完成之后,將最長的結果添加到列表中,然后再獲取第二字符,遍歷所有結尾組合,獲取最長匹配。以此類推。

四、逆向最長匹配

既然了解了正向如何匹配,那么逆向算法應該也很好寫。代碼如下:

def backward_segment(text, dic):
    list = []
    i = len(text) - 1
    while i >= 0:
        long_word = text[i]
        for j in range(0, i):
            word = text[j:i + 1]
            if word in dic:
                if len(word) > len(long_word):
                    long_word = word
                    break
        list.append(long_word)
        i -= len(long_word)
    return list

算法的原理:就是上面的正向反過來,但是這里并不是倒推文字,文字還是按語句的順序,但是長度是從最長到最短,也就是遇到第一個就可以返回了添加了。比正向最長匹配算法節約時間。

五、雙向最長匹配

雖然逆向比正向節約時間,但本身有一個很大的漏洞。假如我現在的句子中有一段“項目的”字符串,那么正向會出現“項目”,“的”兩個詞匯,而逆向會出現:“項”,“目的”兩個詞匯。

為此,我們的算法工程師提出了新的匹配規則,雙向最長匹配。這是一種融合兩種匹配方法的復雜規則,流程如下:

同時執行正向和逆向最長匹配,若兩者的詞數不同,則返回詞數更少的一個否則,返回兩者中單字更少的那一個。當單字也相同時,優先返回逆向最長匹配結果

具體代碼如下:

#統計單字個數
def count_single_char(list):
    return sum(1 for word in list if len(word) == 1)

#雙向匹配算法
def bidirectional_segment():
    f = forward_segment("在絕對實力面前,一切的說辭都是枉然", dic)
    b = backward_segment("在絕對實力面前,一切的說辭都是枉然", dic)
    if len(f)  len(b):
        return f
    elif len(f) > len(b):
        return b
    else:
        if count_single_char(f)count_single_char(b):
            return f
        else:
            return b

到此這篇關于Python自然語言處理之切分算法詳解的文章就介紹到這了,更多相關python切分算法內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python 算法題——快樂數的多種解法
  • python使用ProjectQ生成量子算法指令集
  • Python機器學習算法之決策樹算法的實現與優缺點
  • Python集成學習之Blending算法詳解
  • python3實現Dijkstra算法最短路徑的實現
  • Python實現K-means聚類算法并可視化生成動圖步驟詳解
  • python入門之算法學習
  • Python實現機器學習算法的分類

標簽:臨汾 日照 赤峰 雙鴨山 貴州 陽泉 金華 克拉瑪依

巨人網絡通訊聲明:本文標題《Python自然語言處理之切分算法詳解》,本文關鍵詞  Python,自然語言,處理,之,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python自然語言處理之切分算法詳解》相關的同類信息!
  • 本頁收集關于Python自然語言處理之切分算法詳解的相關信息資訊供網民參考!
  • 推薦文章
    成人在免费观看视频国产| 午夜久久网| 一级女性全黄生活片免费| 国产亚洲免费观看| 九九九网站| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 欧美一区二区三区在线观看| 日日爽天天| 欧美一区二区三区性| 精品国产一级毛片| 欧美a免费| 国产福利免费观看| 亚飞与亚基在线观看| 91麻豆精品国产自产在线观看一区 | 日本免费看视频| 香蕉视频久久| a级精品九九九大片免费看| 欧美日本国产| 久久福利影视| 日韩男人天堂| 欧美大片a一级毛片视频| 国产不卡福利| 一级毛片看真人在线视频| 国产成人精品一区二区视频| 韩国毛片基地| 91麻豆精品国产自产在线 | 久久国产精品永久免费网站| 国产成人精品综合在线| 国产一区精品| 免费国产在线观看| 精品在线观看一区| 天天色成人| 欧美激情伊人| 韩国毛片| 天堂网中文在线| 成人免费观看视频| 欧美国产日韩一区二区三区| 成人免费网站视频ww| 成人免费网站久久久| 国产欧美精品午夜在线播放| 久久久久久久男人的天堂| 欧美激情伊人| 国产成a人片在线观看视频| 国产成人精品一区二区视频| 欧美大片aaaa一级毛片| 亚洲第一页乱| 精品久久久久久综合网| 黄色短视屏| 国产一区二区精品久久91| 天天做日日干| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 国产精品免费精品自在线观看| 欧美另类videosbestsex久久| 91麻豆tv| 亚洲第一页乱| 韩国毛片基地| 日韩字幕在线| 国产伦理精品| 欧美另类videosbestsex久久 | 免费的黄视频| 国产韩国精品一区二区三区| 天天色色网| 欧美爱爱动态| 成人av在线播放| 日韩av片免费播放| 四虎影视久久久免费| 午夜欧美成人久久久久久| 亚洲精品中文字幕久久久久久| 国产一区二区精品久久91| 国产精品自拍在线| 日韩一级黄色大片| 青青久久国产成人免费网站| 欧美电影免费| 成人免费观看男女羞羞视频| 精品视频在线观看视频免费视频 | 久久成人综合网| 亚洲第一页色| 久久精品大片| 国产高清视频免费观看| 久久久久久久久综合影视网| 久久福利影视| 日韩av成人| 亚欧视频在线| 欧美激情一区二区三区视频| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 日本伦理黄色大片在线观看网站| 91麻豆精品国产自产在线 | 中文字幕97| 91麻豆国产| 久久国产一久久高清| 国产极品白嫩美女在线观看看| 日本在线不卡视频| 韩国毛片免费| 国产欧美精品| 青青久久精品国产免费看| 99色视频在线观看| 欧美大片一区| 色综合久久天天综合绕观看| 日韩中文字幕在线播放| 97视频免费在线观看| 青青久久国产成人免费网站| 色综合久久天天综线观看| 免费国产在线视频| 九九干| 九九九国产| 亚洲第一色在线| a级毛片免费观看网站| 欧美爱色| 麻豆网站在线看| 欧美激情一区二区三区视频| 午夜欧美成人久久久久久| 欧美激情伊人| 99色视频| 国产欧美精品| 成人影院一区二区三区| 国产一区二区精品久久91| 成人a大片在线观看| 麻豆系列 在线视频| 国产精品自拍在线| 一级女性全黄生活片免费| 青青青草视频在线观看| 国产91素人搭讪系列天堂| 国产一区二区精品在线观看| 你懂的日韩| 精品视频在线观看视频免费视频 | 精品国产香蕉伊思人在线又爽又黄| 麻豆污视频| 高清一级片| 日韩在线观看免费| 日韩综合| 国产网站免费在线观看| 日本免费看视频| 精品久久久久久综合网| 九九久久99| 亚洲第一视频在线播放| 韩国毛片基地| 日韩中文字幕在线观看视频| 黄视频网站免费看| 国产一区二区精品久久| 欧美日本免费| 免费国产在线视频| 色综合久久天天综合绕观看| 国产精品自拍一区| 国产一区免费观看| 国产一区免费在线观看| 欧美一级视频免费观看| 国产极品精频在线观看| 麻豆午夜视频| 99久久精品费精品国产一区二区| 免费的黄色小视频| 欧美激情影院| 精品在线观看国产| 日本伦理黄色大片在线观看网站| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 欧美国产日韩精品| 精品在线免费播放| 成人高清视频免费观看| 成人高清免费| 午夜在线亚洲男人午在线| 韩国三级香港三级日本三级| 免费国产在线观看不卡| 国产网站免费| 国产不卡在线观看| 精品国产香蕉伊思人在线又爽又黄| 青草国产在线观看| 日本特黄一级| 成人免费网站视频ww| 日韩中文字幕一区二区不卡| 99色视频| 99色视频在线| 精品久久久久久综合网| 欧美1区2区3区| 99久久视频| 台湾美女古装一级毛片| 日韩一级黄色大片| 九九精品影院| 欧美18性精品| 沈樵在线观看福利| 久久精品欧美一区二区| 成人免费观看网欧美片| 精品久久久久久中文| 亚洲 欧美 成人日韩| 午夜精品国产自在现线拍| 亚欧乱色一区二区三区| 国产成a人片在线观看视频| 午夜激情视频在线播放| 91麻豆爱豆果冻天美星空| 天天做人人爱夜夜爽2020毛片| 国产激情视频在线观看| 二级特黄绝大片免费视频大片| 精品视频在线观看视频免费视频 | 四虎影视精品永久免费网站| 精品国产三级a| 欧美a级v片不卡在线观看| 国产欧美精品午夜在线播放| 日韩中文字幕在线观看视频| 久久精品道一区二区三区| 九九干| 久久国产一区二区| 韩国毛片|