原創(chuàng)文章歸屬問題如何鑒別?百度搜索是如何理解的 二維碼
1333
要了解原創(chuàng)文章歸屬問題,在文章發(fā)布前,我們需要了解一些常識(shí)性的問題。下面,遨游建站先帶大家來了解一下這個(gè)問題。 1、要正確署名 文章,屬于著作權(quán)法所規(guī)定的文字作品。所謂文章的發(fā)表,是指將文章公之于眾。而發(fā)表的形式則可以多種多樣,包括傳統(tǒng)的紙質(zhì)媒介上的發(fā)表,也包括在互聯(lián)網(wǎng)網(wǎng)站平臺(tái)上的發(fā)表,比如微博上發(fā)布、BBS論壇上發(fā)布、微信公眾號(hào)上的發(fā)布等等。在司法實(shí)踐中,認(rèn)定作品的著作權(quán)人的主要依據(jù)即為作品上的署名人是誰。但是在現(xiàn)實(shí)生活中,我們有很多作者出于不同的考慮,往往在發(fā)表的文章上署以假名、筆名或不予署名,這就使得維權(quán)或訴訟中,認(rèn)定文章著作權(quán)的歸屬、即誰是作者增加了難度,給我們的維權(quán)或侵權(quán)訴訟帶來了極大的障礙。建議作者在發(fā)表文章之時(shí),盡量使用自己的真實(shí)姓名,如果確實(shí)有其他考慮,可以署筆名或假名,但要留存證據(jù)證明權(quán)屬身份。 2、要標(biāo)注發(fā)布時(shí)間 對于兩篇內(nèi)容構(gòu)成實(shí)質(zhì)相似的文章,法院通常會(huì)推定發(fā)表時(shí)間在后的文章抄襲自發(fā)表時(shí)間在先的文章,因此,文章的發(fā)表時(shí)間對于確定是否具有接觸的可能性以及在先文章的被抄襲可能性方面都具有非常重要的意義。如下圖: 這篇“集團(tuán)型網(wǎng)站建設(shè)需要多少錢?”的文章發(fā)布時(shí)間為2020年1月10日。接下來,我們再來看看下面的圖片: 這篇“集團(tuán)型網(wǎng)站建設(shè)多少錢?有什么特點(diǎn)(點(diǎn)擊閱讀)”的文章發(fā)布時(shí)間為2019年8月26日。兩篇文章,雖然標(biāo)題不一樣,但內(nèi)容基本上沒有變化,兩者一對比,哪個(gè)是原創(chuàng)?哪個(gè)是被轉(zhuǎn)載的?一目了然。 3、仔細(xì)閱讀平臺(tái)規(guī)則 在文章內(nèi)容發(fā)布平臺(tái)發(fā)表文章,要仔細(xì)閱讀線上網(wǎng)站經(jīng)營者發(fā)布的格式合同條款,注意審核有關(guān)文章授權(quán)或轉(zhuǎn)讓條款,避免文章的相關(guān)權(quán)利以合同方式授權(quán)給平臺(tái)方無償使用。 4、引用需要標(biāo)注來源 引用他人微博或評(píng)論文字要標(biāo)注文字來源,并要正確對所引用文字的文章作者署名。 上述內(nèi)容是關(guān)于文章發(fā)表之時(shí)應(yīng)注意的一些問題,接下來,我和大家交流一下,在互聯(lián)網(wǎng)環(huán)境下應(yīng)如何做好維權(quán)的準(zhǔn)備。 互聯(lián)網(wǎng)具有虛擬性,同時(shí)又具有內(nèi)容傳播的快速性和廣泛性,它能讓我們的原創(chuàng)文章迅速得以廣泛傳播,但同時(shí)也能為侵權(quán)人提供便捷的獲取渠道,并能讓侵權(quán)文章得以遍地開花。作為權(quán)利人,我們一旦發(fā)現(xiàn)侵權(quán)文章應(yīng)該如何維權(quán)呢?下面,我將就不同的侵權(quán)主體的網(wǎng)絡(luò)侵權(quán)行為做具體分析: 1、網(wǎng)絡(luò)文章抄襲行為 網(wǎng)絡(luò)文章抄襲行為,主要指侵權(quán)人將原創(chuàng)者的文章部分內(nèi)容或全部內(nèi)容進(jìn)行使用,但未標(biāo)注引用文章的來源和出處,并再次以自己的名義在互聯(lián)網(wǎng)絡(luò)公開發(fā)布的情況。針對此種侵權(quán)行為,要第一時(shí)間對侵權(quán)行為進(jìn)行有效取證和存證,并以提起著作權(quán)侵權(quán)之訴予以維權(quán); 2、文章內(nèi)容平臺(tái)轉(zhuǎn)載行為 文章內(nèi)容平臺(tái)轉(zhuǎn)載行為,是指以對文章內(nèi)容進(jìn)行經(jīng)營和運(yùn)營的內(nèi)容發(fā)布平臺(tái)對原創(chuàng)文章進(jìn)行轉(zhuǎn)載和使用的情況,比如世紀(jì)超星公司、碩博士論文發(fā)布平臺(tái)CNKI、書生電子公司等閱讀平臺(tái)。這些平臺(tái)多以文章的有償付費(fèi)模式進(jìn)行運(yùn)營,在發(fā)現(xiàn)這些平臺(tái)侵權(quán)行為之時(shí),應(yīng)當(dāng)首先對付費(fèi)閱讀的模式以及下載量等進(jìn)行取證,以作為損害賠償?shù)闹饕C據(jù)。 3、第三方信息存儲(chǔ)平臺(tái)轉(zhuǎn)載行為 第三方信息存儲(chǔ)平臺(tái)轉(zhuǎn)載行為,是指侵權(quán)文章通過以向網(wǎng)民提供信息存儲(chǔ)空間為主要模式的網(wǎng)絡(luò)平臺(tái)進(jìn)行傳播的網(wǎng)絡(luò)侵權(quán)行為。微博、微信公眾號(hào)、知乎等均屬于第三方信息存儲(chǔ)平臺(tái),對于此類平臺(tái)上轉(zhuǎn)載侵權(quán)文章的侵權(quán)行為,為第一時(shí)間固定侵權(quán)行為,權(quán)利人可采用現(xiàn)在通行的電子取證軟件進(jìn)行固定證據(jù),之后可通過向平臺(tái)方發(fā)送律師函或線上投訴的方式對侵權(quán)行為進(jìn)行制止,如在投訴之后仍未有效制止侵權(quán)行為,權(quán)利人可以通過向法院提起訴訟的方式進(jìn)行維權(quán)。 以上信息來源于湯加律師的文章。 百度是如何辨別原創(chuàng)文章的 要了解這個(gè)問題,首先,我們要明白seo中的兩個(gè)關(guān)鍵詞:“原創(chuàng)”和“偽原創(chuàng)”。 原創(chuàng):簡單地理解就是第一次在網(wǎng)絡(luò)上發(fā)表的內(nèi)容,以前沒有出現(xiàn)過的內(nèi)容。 偽原創(chuàng):就是從網(wǎng)站找來資料進(jìn)行二次加工,二次修改之后的內(nèi)容,如修改標(biāo)題,修改內(nèi)容,增加些文字或者減少一些文字等。 百度搜索引擎對于原創(chuàng)的判斷是如何進(jìn)行的呢? 主要由以下幾個(gè)方面的因素決定: 快照日期 蜘蛛抓取日期 頁面外鏈的多少 文章修改的程度 舉個(gè)栗子,如果我在我的網(wǎng)站更新了一篇文章,搜索引擎來到這個(gè)網(wǎng)站、并且抓取到了這篇文章,放到數(shù)據(jù)庫,并且在收錄數(shù)據(jù)庫中沒有發(fā)現(xiàn)類似內(nèi)容,那么,就會(huì)被認(rèn)定是原創(chuàng)。 1、文章被轉(zhuǎn)載 如果剛發(fā)表的一篇文章被其它轉(zhuǎn)載了,那么誰是原創(chuàng)呢?那要看誰更先被搜索引擎抓取到,也就是更新周期的問題了。如果在自己的網(wǎng)站發(fā)表被其他網(wǎng)站轉(zhuǎn)載,如果先抓取到前者站,那么歸a,如果先抓取b站,那么原創(chuàng)就歸b站了,所以不是說你先發(fā)表了,原創(chuàng)就是你的,這個(gè)得看搜索引擎什么時(shí)間收錄了你的內(nèi)容。 2、文章收錄 文章必須被收錄,如果沒有被收錄,肯定是在搜索數(shù)據(jù)庫中石找不到的,搜索引擎根本就找不到這篇文章,更談不上什么原創(chuàng)了。 3、訪問時(shí)間 如果蜘蛛先訪問了B站呢? 3.1、當(dāng)然權(quán)重給B站,一般的情況下都會(huì)這樣! 3.2、如果B站轉(zhuǎn)載的文章帶了A站的原文章頁面鏈接呢? 3.3、這就很明白了,剛收錄的時(shí)候,如果排名,兩條結(jié)果一起出現(xiàn),有可能還是B站的排名好一點(diǎn)。 當(dāng)然,文章轉(zhuǎn)載次數(shù)多了以后,A站的鏈接越多,對A站的文章越有好處,排名會(huì)慢慢變成A站在前面。 如果另外轉(zhuǎn)載的文章帶的是B站頁面的鏈接呢?它們?nèi)绻袛嗖缓?,就變成了一個(gè)鏈接流行度的比賽了。 不過,如果都有很多外部鏈接,并且相差不大,那么判斷的規(guī)則應(yīng)該回到原點(diǎn),誰先被收錄誰就是原創(chuàng)。 4、偽原創(chuàng) 偽原創(chuàng)也會(huì)被認(rèn)為是原創(chuàng)? 大多時(shí)候是這樣的,搜索引擎蜘蛛不能明確分別這些東西,因?yàn)樗乃季S太程式化了。如果你的標(biāo)題改過,文章的段落改過,那么蜘蛛將很難確定這篇文章是否有過收錄,也許它可以確定有部分內(nèi)容是重復(fù)的,但它也不能因?yàn)檫@些而將這篇文章確認(rèn)為是轉(zhuǎn)載!當(dāng)然,隨著搜索引擎程式設(shè)計(jì)的提高,應(yīng)該會(huì)有一個(gè)相似度的東西出來,比如文字內(nèi)容相似度超過百分之幾就會(huì)被認(rèn)為是轉(zhuǎn)載。 另外提幾個(gè)建議: 4.1、如果你的站是新站,權(quán)重不高,如何讓蜘蛛首頁找到你的頁面并放入數(shù)據(jù)庫?其實(shí)很簡單:用網(wǎng)摘、bd收藏這些工具讓蜘蛛更快的找到你的頁面! 4.2、大家都有過建議,就是加上自己的版權(quán)及內(nèi)容頁面的地址,別人采集的時(shí)候你就爽了,收錄雖然不會(huì)快,但最后鏈接多了,你依然是原創(chuàng)內(nèi)容。 4.3、發(fā)表文章等到自己收錄以后再去其它的站點(diǎn)進(jìn)行發(fā)表,同時(shí)加上自己的原文地址,這種辦法很有保障! 5、快照日期 快照日期顯示時(shí)間最早的,一般就是原創(chuàng)了吧! 不一定,這個(gè)說法要在一個(gè)更新周期之內(nèi),比如說文章發(fā)表后一周內(nèi),快照時(shí)間越早的地址將越有被認(rèn)可為原創(chuàng)的可能。 但如果文章都發(fā)表了幾個(gè)月了,說不定搜索引擎已經(jīng)重新獲取過快照了,快照的日期就變了! 還有其它的可能嗎?有,一般比如百度收錄,他可能會(huì)有一個(gè)收錄的數(shù)據(jù)庫,經(jīng)過過濾后,收錄的內(nèi)容才會(huì)到搜索結(jié)果里來。在這個(gè)期間就有一些問題了,比如A站首次發(fā)表,B站轉(zhuǎn)載。蜘蛛先訪問A站再訪問B站。而后可能先把B站的結(jié)果放出來了,而A站還在數(shù)據(jù)庫里。 所以說,搜索引擎沒有收錄并不表示搜索引擎蜘蛛沒有訪問過這些內(nèi)容,也許在搜索引擎的庫存里已經(jīng)有記錄了,只是你查的時(shí)間沒有放出來而已,就像25號(hào)才放出來的內(nèi)容,但是快照是20號(hào)的,這就是搜索引擎的庫存內(nèi)容,同時(shí)這也是檢驗(yàn)原創(chuàng)的核心時(shí)間點(diǎn)。 這種情況一般出現(xiàn)在新站與老站之間,A站發(fā)表,B站轉(zhuǎn)載,但A站在搜索引擎的信任度并不高的時(shí)候。不過只要是A站先被訪問到的,原創(chuàng)權(quán)還是A站的,這是最難分出來的情況,因?yàn)槲覀儾恢乐┲胂仍L問哪個(gè)站,除非你知道兩個(gè)站的網(wǎng)站空間日志內(nèi)容,能看到搜索引擎對兩個(gè)頁面的訪問時(shí)間。 是否原創(chuàng)其實(shí)根本就沒有明顯的界限,因?yàn)?,有些東西它本身含有的知識(shí)點(diǎn)都是重復(fù)的。舉個(gè)例子,寫“如何做西紅柿炒雞蛋”的文章,雖然會(huì)有千奇百怪的寫法,但是,如果將1萬個(gè)人關(guān)在小屋里,給他們筆和紙,讓他們寫,寫完上交后。不難發(fā)現(xiàn),其中會(huì)有幾篇內(nèi)容是相似的!如果我們作為審閱人,在不知情的情況下,會(huì)認(rèn)為這些文章中有抄襲的,如果讓搜索引擎來看這1萬篇“如何做西紅柿炒雞蛋”的文章,又會(huì)如何呢? 在搜索引擎中,信息量十分的龐大,它又是如何辨別原創(chuàng)的呢?其實(shí)這是一個(gè)十分有趣的問題。百度判斷文章的原創(chuàng)程度會(huì)有2次篩選:一次是蜘蛛爬行抓取文章時(shí),對抓取數(shù)據(jù)的重復(fù)檢測;一次是在搜索引擎讀取文章內(nèi)容的時(shí)候,對文章內(nèi)容重復(fù)度的檢查。 對于第一次篩選,是按照數(shù)據(jù)的相似度來判斷的(包括了代碼)。搜索引擎會(huì)根據(jù)無數(shù)的文章資源來判定一個(gè)相似度百分比(因?yàn)榫W(wǎng)絡(luò)資源不斷地更新,這個(gè)判斷標(biāo)準(zhǔn)也不斷的變化),超過一定的相似度,文章就會(huì)被pass掉。第一次篩選相對而言,并不嚴(yán)格。 第二次篩選,則是針對文章的主要內(nèi)容(不包含代碼),篩選的方法也是根據(jù)相似度來判斷。搜索引擎它會(huì)把網(wǎng)頁中沒用的部分去掉(代碼和一些沒用的感嘆詞、介詞等),通過分詞,將一個(gè)頁面的內(nèi)容分成很多個(gè)關(guān)鍵詞(這些關(guān)鍵詞便是這個(gè)頁面的核心內(nèi)容),然后把頁面中的關(guān)鍵詞存儲(chǔ)在數(shù)據(jù)庫中,然后會(huì)通過數(shù)據(jù)庫資源的對比,來決定文章的原創(chuàng)度(就像指紋一樣,如果指紋完全符合,那就說明這個(gè)指紋是你的,對于文章而言,數(shù)據(jù)相同,便是抄襲的)。 對于第二次篩選有好處也有優(yōu)點(diǎn)。通過去掉沒用的詞,如“的”、“嗎”等,再來對比會(huì)更加準(zhǔn)確,但是同樣的,一個(gè)頁面除了文章外,還有很多其他的不同內(nèi)容,因此,判別起來也會(huì)有寫難度,甚至?xí)斐沙u文章也會(huì)收錄的現(xiàn)象。 搜索引擎每天都會(huì)獲取大量的數(shù)據(jù),因此,判定文章原創(chuàng)度的標(biāo)準(zhǔn)也在浮動(dòng),因此會(huì)出現(xiàn)文章收錄后被吐出來,或者沒有收錄的文章又被收錄了。 關(guān)于原創(chuàng)文章方面的一些常見問題 1、為什么相同的文章發(fā)在不同的平臺(tái)都會(huì)被收錄? 這個(gè)問題不難回答。我們再看看上面舉得寫“如何做西紅柿炒雞蛋”的這個(gè)例子。對于搜索引擎而言,這樣的文章里面的關(guān)鍵詞幾乎都是一樣的(雞蛋、西紅柿等)。但是,這1萬篇文章是每個(gè)人動(dòng)手寫的,沒有抄襲的可能,但是因?yàn)樽鞣ㄏ嗤?,而出現(xiàn)了文章相似程度極高(指紋幾乎都是一樣的)的情況。面對這種情況,搜索引擎也會(huì)有自己的處理方法:把收錄條件降低。這也造成了,偽原創(chuàng)的出現(xiàn)(偽原創(chuàng)文章收錄相對而言還是不錯(cuò)的)。 除此之外,就算是抄襲文章,文章頁除了文章外,還有很多其他的內(nèi)容,這些都會(huì)是影響文章原創(chuàng)度的因素!另外,百度的數(shù)據(jù)庫極為龐大,一天就處理數(shù)百萬的文章,會(huì)出現(xiàn)反應(yīng)遲緩的現(xiàn)象,造成文章先收錄后吐出的現(xiàn)象。 還有比較特殊的一點(diǎn)是,搜索引擎的目的便是為用戶提供有用的訊息,會(huì)盡可能的提供更多的搜索結(jié)果來滿足用戶的需求,特別是對于一些有時(shí)效性的新聞,搜索引擎會(huì)希望這些內(nèi)容更快的傳遞,所以會(huì)收錄一些內(nèi)容相似、甚至內(nèi)容完全一樣的文章。 以上種種因素都會(huì)造成搜素引擎收錄兩篇幾乎一樣的文章的現(xiàn)象出現(xiàn)。 2、為什么文章收錄后過段時(shí)間又沒了? 如果是原創(chuàng)文章,這種幾率很低,也并不是沒有。如:(1)你的文章被高權(quán)重網(wǎng)站采集了(這種情況聯(lián)系對方的站長)。(2)偽原創(chuàng)。對于偽裝創(chuàng),收錄后過段時(shí)間就沒了,這是正常的,對于百度而言,每天都會(huì)采集大量的信息,因此決定文章收錄的數(shù)據(jù)庫指紋種類也不斷的變化,所以會(huì)出現(xiàn)此種情況。 3、為什么權(quán)重越高的平臺(tái)文章會(huì)收錄得越快? 舉例子來說,買東西我們習(xí)慣性的看品牌?因?yàn)槲覀儠?huì)認(rèn)為該品牌的東西質(zhì)量好。搜索引擎也是一樣,對于它默認(rèn)的一些好的、大型的網(wǎng)站,會(huì)默認(rèn)為這網(wǎng)站的內(nèi)容好,所以,蜘蛛爬行的就會(huì)頻繁,甚至有時(shí)候,這些網(wǎng)站純粹的粘貼、復(fù)制,也會(huì)比小網(wǎng)站收錄快很多。畢竟小網(wǎng)站流量有限。 以信載商,良心建站。遨游始終秉承“一次建站、終身維護(hù)”的宗旨,竭誠為客戶提供最優(yōu)質(zhì)的互聯(lián)網(wǎng)服務(wù)。遨游建站率先植入seo優(yōu)化理念,讓你的網(wǎng)頁更利于搜索引擎抓取,關(guān)鍵詞排名更靠前。可仿站、可定制。無論是傳統(tǒng)型企業(yè)官網(wǎng)、集團(tuán)型品牌官網(wǎng),還是營銷型網(wǎng)站、電商型網(wǎng)站、定制型網(wǎng)站、特殊行業(yè)網(wǎng)站(醫(yī)療、教育),全部搞定。 公司:網(wǎng)站建設(shè)_小程序設(shè)計(jì)_競價(jià)托管代運(yùn)營公司;郵箱:1013601535@qq.com 手機(jī):17073547034;QQ: 1013601535 在線留言咨詢,24小時(shí)內(nèi)回復(fù)
我想咨詢 *
企業(yè)名稱
手機(jī)號(hào)碼 *
您的姓名
所在城市 提交 |
網(wǎng)站建設(shè)問題
熱門標(biāo)簽
最新發(fā)布 |