国产午夜成人免费看片无遮挡_日本免费xxxx色视频_免费人成网上在线观看_黄网址在线永久免费观看

當前位置:雨林木風下載站 > 網頁設計教程 > 詳細頁面

搜索引擎判定相似文章頁面的原理大解析

搜索引擎判定相似文章頁面的原理大解析

更新時間:2019-08-06 文章作者:未知 信息來源:網絡 閱讀次數:

SEO(Search Engine Optimization):漢譯為搜索引擎優化。是一種方式:利用搜索引擎的規則提高網站在有關搜索引擎內的自然排名。目的是:為網站提供生態式的自我營銷解決方案,讓其在行業內占據領先地位,獲得品牌收益;SEO包含站外SEO和站內SEO兩方面;為了從搜索引擎中獲得更多的免費流量,從網站結構、內容建設方案、用戶互動傳播、頁面等角度進行合理規劃,還會使搜索引擎中顯示的網站相關信息對用戶來說更具有吸引力。

  在上一篇文章中已經詳細的介紹了利用TF-IDF算法自動提取文章關鍵詞的原理。接下來,我們再來研究一下另一個相關的問題。這個問題也是我們做 SEO的最關心的,有些時候,我們除了要明白如何找到并提取文章關鍵詞,我們還需要找到與原文章相似的其他文章。比如,我們平時在搜索引擎的新聞欄目下搜索某條新聞的時候,在主新聞下方,還提供了多條相似的新聞。如下圖所示:

搜索引擎判定相似文章網頁的原理大解析 三聯

  為了找出相似的文章,我們就需要用到另外一個公式原理了,那就是“余弦相似性(cosine similiarity)”。

  一、什么是"余弦相似性"?

  余弦相似性是指通過測量兩個向量內積空間的夾角的余弦值來度量它們之間的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1。從而兩個向量之間的角度的余弦值確定兩個向量是否大致指向相同的方向。兩個向量有相同的指向時,余弦相似度的值為1;兩個向量夾角為90° 時,余弦相似度的值為0;兩個向量指向完全相反的方向時,余弦相似度的值為-1。在比較過程中,向量的規模大小不予考慮,僅僅考慮到向量的指向方向。余弦相似度通常用于兩個向量的夾角小于90°之內,因此余弦相似度的值為0到1之間。

  值得注意的是余弦相似度可以用在任何維度的向量比較中,它尤其在高維正空間中的利用尤為頻繁。例如在信息檢索中,每個詞條擁有不同的度,一個文檔是由一個由有權值的特征向量表示的,權值的計算取決于詞條在該文檔中出現的頻率。余弦相似度因此可以給出兩篇文檔其主題方面的相似度。

  二、搜索引擎是如何判定相似文章的?

  下面,馬海祥還是以舉例子的方式來說明如何才能找出相似文章?

  為了簡單起見,我們先從句子著手。

  句子A: 我喜歡看電視,不喜歡看電影。

  句子B: 我不喜歡看電視,也不喜歡看電影。

  那么我們怎樣才能計算出上面兩句話的相似程度呢?

  馬海祥建議的基本思路是:如果這兩句話的用詞越相似,它們的內容就應該越相似。因此,可以從詞頻入手,計算它們的相似程度。

  第1步:分詞

  句子A:我/喜歡/看/電視,不/喜歡/看/電影。

  句子B:我/不/喜歡/看/電視,也/不/喜歡/看/電影。

  第2步:列出所有的詞

  我,喜歡,看,電視,電影,不,也。

  第3步:計算詞頻

  句子A:我 1,喜歡 2,看 2,電視 1,電影 1,不 1,也 0。

  句子B:我 1,喜歡 2,看 2,電視 1,電影 1,不 2,也 1。

  第4步:寫出詞頻向量

  句子A:[1, 2, 2, 1, 1, 1, 0]

  句子B:[1, 2, 2, 1, 1, 2, 1]

  到這里,問題就變成了如何計算這兩個向量的相似程度。

  我們可以把它們想象成空間中的兩條線段,都是從原點([0, 0, ...])出發,指向不同的方向。兩條線段之間形成一個夾角,如果夾角為0度,意味著方向相同、線段重合;如果夾角為90度,意味著形成直角,方向完全不相似;如果夾角為180度,意味著方向正好相反。因此,我們可以通過夾角的大小,來判斷向量的相似程度。夾角越小,就代表越相似,如下圖所示:

2

  以二維空間為例,上圖的a和b是兩個向量,我們要計算它們的夾角θ。余弦定理告訴我們,可以用下面的公式求得:

3
4

  假定a向量是[x1, y1],b向量是[x2, y2],那么馬海祥覺得就可以將余弦定理改寫成下面的形式:

5
6

  數學家也已經證明,余弦的這種計算方法對n維向量也成立。假定A和B是兩個n維向量,A是 [A1, A2, ..., An] ,B是 [B1, B2, ..., Bn] ,則A與B的夾角θ的余弦等于:

7

  使用這個公式,我們就可以得到,句子A與句子B的夾角的余弦,如下圖所示:

8

  余弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似,這就叫“余弦相似性”。所以,上面的句子A和句子B是很相似的,事實上它們的夾角大約為20.3度。

  由此,我們就得到了“找出相似文章”的一種算法:

  (1)使用TF-IDF算法,找出兩篇文章的關鍵詞;

  (2)每篇文章各取出若干個關鍵詞(比如20個),合并成一個集合,計算每篇文章對于這個集合中的詞的詞頻(為了避免文章長度的差異,可以使用相對詞頻);

  (3)生成兩篇文章各自的詞頻向量;

  (4)計算兩個向量的余弦相似度,值越大就表示越相似。

  馬海祥覺得“余弦相似度”也可能只是搜索引擎在文章相識度其中的一方面的算法,但的確也是一種非常有用的算法,而且就是在其他領域的,只要是計算兩個向量的相似程度,都可以利用這個原理。

  本文為馬海祥博客原創文章,如有轉載,請注明原文摘自于http://www.mahaixiang.cn/seoyjy/293.html,注明出處;否則,禁止轉載,謝謝配合!

搜索引擎優化在國外發展迅速,國內也有眾多的優化愛好者。通過了解各類搜索引擎抓取互聯網頁面、進行索引以及確定其對特定關鍵詞搜索結果排名等技術,來對網頁進行相關的優化,使其提高搜索引擎排名。

溫馨提示:喜歡本站的話,請收藏一下本站!

本類教程下載

系統下載排行

国产午夜成人免费看片无遮挡_日本免费xxxx色视频_免费人成网上在线观看_黄网址在线永久免费观看

  • <label id="pxtpz"><meter id="pxtpz"></meter></label>
      1. <span id="pxtpz"><optgroup id="pxtpz"></optgroup></span>

        日韩美女精品在线| 国产欧美精品国产国产专区 | 精品亚洲成av人在线观看| 欧美日韩国产另类不卡| 日韩美一区二区三区| 在线看国产日韩| 亚洲亚洲人成综合网络| 91麻豆精品国产91久久久使用方法 | 久久99精品久久久久| 日本一区二区在线不卡| 欧洲在线/亚洲| 国产一区二区三区在线看麻豆 | 亚洲精品一区二区三区蜜桃下载| 国产一区不卡精品| 亚洲最大成人网4388xx| 欧美一级日韩免费不卡| 成人高清免费在线播放| 丝袜国产日韩另类美女| 日本一区免费视频| 欧美一区二区三区视频免费播放| 成人福利视频在线看| 日韩—二三区免费观看av| 国产免费观看久久| 欧美人与性动xxxx| 99精品偷自拍| 国产成人免费在线视频| 蜜臀久久久久久久| 夜夜嗨av一区二区三区网页| 中文欧美字幕免费| 日韩三级在线免费观看| 色婷婷精品久久二区二区蜜臀av | 国产一区二区日韩精品| 亚洲免费在线电影| 日本一区二区三区电影| 欧美r级在线观看| 欧美伊人久久久久久午夜久久久久| 91在线无精精品入口| 精品一区二区三区视频在线观看| 樱桃国产成人精品视频| 国产精品视频免费| 久久久国产综合精品女国产盗摄| 日韩欧美综合在线| 91精品国产欧美一区二区18| 欧美性感一区二区三区| 色94色欧美sute亚洲线路一久| 成人丝袜高跟foot| 成人精品免费视频| 成人综合激情网| 成人一区二区三区视频| 成人精品国产一区二区4080| 成人小视频在线| 成人av在线资源网| www.日韩av| 91麻豆免费在线观看| 99久久国产综合精品麻豆| 国产成人免费在线| 成人免费视频国产在线观看| 成人精品一区二区三区中文字幕 | 亚洲美女在线一区| 日韩美女久久久| 亚洲综合色在线| 一区二区三区.www| 亚洲成人免费在线| 蜜臀av一区二区在线免费观看| 五月天激情综合网| 美女视频网站黄色亚洲| 精品亚洲porn| 国产盗摄女厕一区二区三区 | 91精品国产91久久综合桃花| 欧美一区欧美二区| 欧美日韩高清一区二区三区| 亚洲人成网站精品片在线观看| 亚洲精品欧美在线| 青青草国产精品97视觉盛宴| 国产精品一线二线三线| 91免费国产视频网站| 欧美日韩一区久久| 精品国产一区二区三区久久久蜜月| 久久久久国产精品麻豆ai换脸| 国产精品久久午夜夜伦鲁鲁| 亚洲成av人在线观看| 国内精品伊人久久久久av影院 | 国产美女精品人人做人人爽 | 欧美亚洲国产bt| 日韩欧美二区三区| 国产精品女上位| 午夜激情一区二区| 成人在线视频首页| 欧美日韩aaaaaa| 国产精品欧美一区二区三区| 亚洲已满18点击进入久久| 日本中文字幕一区二区有限公司| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 国产一区不卡在线| 97精品久久久久中文字幕| 欧美夫妻性生活| 中文字幕乱码日本亚洲一区二区| 亚洲成人av一区二区三区| 国产精品88av| 欧美精品久久99| 国产精品毛片无遮挡高清| 日本亚洲天堂网| 91色九色蝌蚪| 国产精品理伦片| 狠狠色综合日日| 欧美色偷偷大香| 国产精品免费久久久久| 日韩国产一区二| 91麻豆国产福利精品| 26uuu亚洲| 日本vs亚洲vs韩国一区三区 | 国内外成人在线| 欧美精品视频www在线观看| 国产精品毛片大码女人| 免费高清成人在线| 欧美日韩成人综合天天影院| 亚洲少妇中出一区| 粉嫩蜜臀av国产精品网站| 久久先锋影音av| 久久99热这里只有精品| 欧美一卡二卡在线观看| 午夜精品久久久久影视| 在线观看av不卡| 亚洲一区二区不卡免费| 97精品国产露脸对白| 国产精品视频免费| 国产91在线|亚洲| 国产亚洲精久久久久久| 国产精品一区免费在线观看| 久久久三级国产网站| 国产乱码一区二区三区| 国产欧美一区二区在线| 暴力调教一区二区三区| 国产精品对白交换视频| 91麻豆福利精品推荐| 麻豆精品一区二区综合av| 欧美日本一道本在线视频| 午夜婷婷国产麻豆精品| 91精品国产入口| 国产在线精品不卡| 精品91自产拍在线观看一区| 国产精品99久久久久久似苏梦涵| 国产无一区二区| 99精品在线观看视频| 亚洲欧洲av在线| 欧美性视频一区二区三区| 久久精品国产一区二区三区免费看| 欧美一区二区三区喷汁尤物| 奇米影视一区二区三区| 2023国产一二三区日本精品2022| 国产成人免费网站| 亚洲男人的天堂网| 日韩欧美激情四射| 国产成人精品1024| 一区二区三区四区不卡在线| 欧美一级片免费看| 波多野结衣的一区二区三区| 18欧美乱大交hd1984| 亚洲欧洲综合另类在线| 粉嫩一区二区三区性色av| 欧洲精品一区二区| 亚洲女与黑人做爰| 久久先锋影音av| 欧美性色欧美a在线播放| 亚洲综合在线免费观看| 日韩精品一二三区| 一区二区三区精品视频| 欧美极品aⅴ影院| 国产精品短视频| 久久久综合精品| 国产欧美日韩精品一区| 91麻豆文化传媒在线观看| 国产精品成人网| 国产亚洲va综合人人澡精品| 日本一区二区不卡视频| 日韩三级av在线播放| 色偷偷成人一区二区三区91| 99久久国产综合精品色伊| 欧美特级限制片免费在线观看| 精品嫩草影院久久| 成人v精品蜜桃久久一区| 成人深夜视频在线观看| av电影在线观看不卡| 成人av网站在线观看免费| 国产精品一区二区三区四区| 91网页版在线| 日本中文一区二区三区| 伊人性伊人情综合网| 国产精品免费av| 亚洲一区二区偷拍精品| 亚洲国产aⅴ成人精品无吗| 国产精品免费久久久久| 一区二区在线观看免费| 欧美草草影院在线视频| 欧美videos大乳护士334| 亚洲色图视频网| 国产精品亚洲视频| 在线亚洲人成电影网站色www| 精品一区二区三区的国产在线播放| 亚洲精品中文在线影院|