คอมมอนครอวล์ (Common Crawl) เป็นองค์การไม่แสวงหาผลกำไรตามมาตรา ที่ดำเนินธุรกิจเว็บครอว์เลอร์ และให้บริการชุดข้อมูลและ จดหมายเหตุอย่างอิสระของคอมมอนครอวล์ประกอบไปด้วยข้อมูลหลายเพตะไบต์ที่รวบรวมมาตั้งแต่ปี 2011 โดยปกติแล้ว การรวบรวมข้อมูลจะดำเนินการทุกเดือน
ประเภท | ไม่แสวงผลกำไร |
---|---|
เว็บไซต์ | commoncrawl |
ภาษาที่มี | อังกฤษ |
คอมมอนครอวล์ได้รับการก่อตั้งโดย มีที่ปรึกษา ได้แก่ ปีเตอร์ นอร์วิก และ เคารพนโยบาย และ ในการทำการรวบรวมข้อมูล ซอร์สโค้ดสำหรับการประมวลผลชุดข้อมูลนั้นได้มีเผยแพร่ต่อสาธารณะเช่นกัน
ชุดข้อมูลประกอบด้วยผลงานที่มีลิขสิทธิ์ซึ่งจัดทำโดยทางสหรัฐอเมริกา ภายใต้การใช้ลิขสิทธิ์ของผู้อื่นโดยชอบ ได้มีนักวิจัยจากประเทศอื่น ๆ หลีกเลี่ยงกฎหมายลิขสิทธิ์ในประเทศอื่น ๆ โดยการสลับเปลี่ยนข้อความหรืออ้างอิงชุดข้อมูลทั่วไป
อ้างอิง
- Rosanna Xia (February 5, 2012). "Tech entrepreneur Gil Elbaz made it big in L.A." Los Angeles Times. สืบค้นเมื่อ July 31, 2014.
- "Gil Elbaz and Common Crawl". NBC News. April 4, 2013. สืบค้นเมื่อ July 31, 2014.
- "So you're ready to get started". สืบค้นเมื่อ 2018-06-02.
- Lisa Green (January 8, 2014). "Winter 2013 Crawl Data Now Available". สืบค้นเมื่อ June 2, 2018.
- "Startups - Gil Elbaz and Nova Spivack of Common Crawl - TWiST #222". This Week In Startups. January 10, 2012.
- Tom Simonite (January 23, 2013). "A Free Database of the Entire Web May Spawn the Next Google". MIT Technology Review. สืบค้นเมื่อ July 31, 2014.
- Schäfer, Roland. "CommonCOW: Massively Huge Web Corpora from CommonCrawl Data and a Method to Distribute them Freely under Restrictive EU Copyright Laws". Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC'16). Portorož, Slovenia: European Language Resources Association (ELRA): 4501.
wikipedia, แบบไทย, วิกิพีเดีย, วิกิ หนังสือ, หนังสือ, ห้องสมุด, บทความ, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม, มือถือ, โทรศัพท์, Android, iOS, Apple, โทรศัพท์โมบิล, Samsung, iPhone, Xiomi, Xiaomi, Redmi, Honor, Oppo, Nokia, Sonya, MI, PC, พีซี, web, เว็บ, คอมพิวเตอร์
khxmmxnkhrxwl Common Crawl epnxngkhkarimaeswnghaphlkairtammatra thidaeninthurkicewbkhrxwelxr aelaihbrikarchudkhxmulaela cdhmayehtuxyangxisrakhxngkhxmmxnkhrxwlprakxbipdwykhxmulhlayephtaibtthirwbrwmmatngaetpi 2011 odypktiaelw karrwbrwmkhxmulcadaeninkarthukeduxnkhxmmxnkhrxwlpraephthimaeswngphlkairewbistcommoncrawl wbr orgphasathimixngkvs khxmmxnkhrxwlidrbkarkxtngody mithipruksa idaek pietxr nxrwik aela ekharphnoybay aela inkarthakarrwbrwmkhxmul sxrsokhdsahrbkarpramwlphlchudkhxmulnnidmiephyaephrtxsatharnaechnkn chudkhxmulprakxbdwyphlnganthimilikhsiththisungcdthaodythangshrthxemrika phayitkarichlikhsiththikhxngphuxunodychxb idminkwicycakpraethsxun hlikeliyngkdhmaylikhsiththiinpraethsxun odykarslbepliynkhxkhwamhruxxangxingchudkhxmulthwipxangxingRosanna Xia February 5 2012 Tech entrepreneur Gil Elbaz made it big in L A Los Angeles Times subkhnemux July 31 2014 Gil Elbaz and Common Crawl NBC News April 4 2013 subkhnemux July 31 2014 So you re ready to get started subkhnemux 2018 06 02 Lisa Green January 8 2014 Winter 2013 Crawl Data Now Available subkhnemux June 2 2018 Startups Gil Elbaz and Nova Spivack of Common Crawl TWiST 222 This Week In Startups January 10 2012 Tom Simonite January 23 2013 A Free Database of the Entire Web May Spawn the Next Google MIT Technology Review subkhnemux July 31 2014 Schafer Roland CommonCOW Massively Huge Web Corpora from CommonCrawl Data and a Method to Distribute them Freely under Restrictive EU Copyright Laws Proceedings of the Tenth International Conference on Language Resources and Evaluation LREC 16 Portoroz Slovenia European Language Resources Association ELRA 4501