คอมมอนครอวล์ (Common Crawl) เป็นองค์การไม่แสวงหาผลกำไรตามมาตรา ที่ดำเนินธุรกิจเว็บครอว์เลอร์ และให้บริการชุดข้อมูลและ จดหมายเหตุอย่างอิสระของคอมมอนครอวล์ประกอบไปด้วยข้อมูลหลายเพตะไบต์ที่รวบรวมมาตั้งแต่ปี 2011 โดยปกติแล้ว การรวบรวมข้อมูลจะดำเนินการทุกเดือน
ประเภท | ไม่แสวงผลกำไร |
---|---|
เว็บไซต์ | commoncrawl |
ภาษาที่มี | อังกฤษ |
คอมมอนครอวล์ได้รับการก่อตั้งโดย มีที่ปรึกษา ได้แก่ ปีเตอร์ นอร์วิก และ เคารพนโยบาย และ ในการทำการรวบรวมข้อมูล ซอร์สโค้ดสำหรับการประมวลผลชุดข้อมูลนั้นได้มีเผยแพร่ต่อสาธารณะเช่นกัน
ชุดข้อมูลประกอบด้วยผลงานที่มีลิขสิทธิ์ซึ่งจัดทำโดยทางสหรัฐอเมริกา ภายใต้การใช้ลิขสิทธิ์ของผู้อื่นโดยชอบ ได้มีนักวิจัยจากประเทศอื่น ๆ หลีกเลี่ยงกฎหมายลิขสิทธิ์ในประเทศอื่น ๆ โดยการสลับเปลี่ยนข้อความหรืออ้างอิงชุดข้อมูลทั่วไป
อ้างอิง
- Rosanna Xia (February 5, 2012). "Tech entrepreneur Gil Elbaz made it big in L.A." Los Angeles Times. สืบค้นเมื่อ July 31, 2014.
- "Gil Elbaz and Common Crawl". NBC News. April 4, 2013. สืบค้นเมื่อ July 31, 2014.
- "So you're ready to get started". สืบค้นเมื่อ 2018-06-02.
- Lisa Green (January 8, 2014). "Winter 2013 Crawl Data Now Available". สืบค้นเมื่อ June 2, 2018.
- "Startups - Gil Elbaz and Nova Spivack of Common Crawl - TWiST #222". This Week In Startups. January 10, 2012.
- Tom Simonite (January 23, 2013). "A Free Database of the Entire Web May Spawn the Next Google". MIT Technology Review. สืบค้นเมื่อ July 31, 2014.
- Schäfer, Roland. "CommonCOW: Massively Huge Web Corpora from CommonCrawl Data and a Method to Distribute them Freely under Restrictive EU Copyright Laws". Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC'16). Portorož, Slovenia: European Language Resources Association (ELRA): 4501.
wikipedia, แบบไทย, วิกิพีเดีย, วิกิ หนังสือ, หนังสือ, ห้องสมุด, บทความ, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม, มือถือ, โทรศัพท์, Android, iOS, Apple, โทรศัพท์โมบิล, Samsung, iPhone, Xiomi, Xiaomi, Redmi, Honor, Oppo, Nokia, Sonya, MI, PC, พีซี, web, เว็บ, คอมพิวเตอร์
rawngsbsnkb khxmmxnlxw khxmmxnkhrxwl Common Crawl epnxngkhkarimaeswnghaphlkairtammatra 501 c thidaeninthurkicewbkhrxwelxr aelaihbrikarchudkhxmulaela cdhmayehtuxyangxisra 1 2 hnwyekbthawrbnewbkhxngkhxmmxnkhrxwlprakxbipdwykhxmulhlayephtaibtthirwbrwmmatngaetpi 2011 3 odypktiaelw karrwbrwmkhxmulcadaeninkarthukeduxn 4 khxmmxnkhrxwlpraephthimaeswngphlkairewbistcommoncrawl wbr orgphasathimixngkvs khxmmxnkhrxwlidrbkarkxtngodycil exlbas 5 mithipruksa idaek pietxr nxrwik aela ocxici xiot 6 ekharphnoybay Nofollow aela robots txt inkarthakarrwbrwmkhxmul sxrsokhdsahrbkarpramwlphlchudkhxmulnnidmiephyaephrtxsatharnaechnkn chudkhxmulprakxbdwyphlnganthimilikhsiththisungcdthaodythangshrthxemrika phayitkarichlikhsiththikhxngphuxunodychxb idminkwicycakpraethsxun hlikeliyngkdhmaylikhsiththiinpraethsxun odykarslbepliynkhxkhwamhruxxangxingchudkhxmulthwip 7 xangxingaek Rosanna Xia February 5 2012 Tech entrepreneur Gil Elbaz made it big in L A Los Angeles Times subkhnemux July 31 2014 Gil Elbaz and Common Crawl NBC News April 4 2013 subkhnemux July 31 2014 So you re ready to get started subkhnemux 2018 06 02 Lisa Green January 8 2014 Winter 2013 Crawl Data Now Available subkhnemux June 2 2018 Startups Gil Elbaz and Nova Spivack of Common Crawl TWiST 222 This Week In Startups January 10 2012 Tom Simonite January 23 2013 A Free Database of the Entire Web May Spawn the Next Google MIT Technology Review subkhnemux July 31 2014 Schafer Roland CommonCOW Massively Huge Web Corpora from CommonCrawl Data and a Method to Distribute them Freely under Restrictive EU Copyright Laws Proceedings of the Tenth International Conference on Language Resources and Evaluation LREC 16 Portoroz Slovenia European Language Resources Association ELRA 4501 ekhathungcak https th wikipedia org w index php title khxmmxnkhrxwl amp oldid 11801279