{"id":7775,"date":"2024-04-26T22:02:46","date_gmt":"2024-04-26T20:02:46","guid":{"rendered":"http:\/\/www.kameli.net\/marq\/?p=7775"},"modified":"2024-04-26T22:12:44","modified_gmt":"2024-04-26T20:12:44","slug":"spammifiltterin-suunnittelua","status":"publish","type":"post","link":"http:\/\/www.kameli.net\/marq\/?p=7775","title":{"rendered":"Sp\u00e4mmifiltterin suunnittelua"},"content":{"rendered":"\n<p>En tied\u00e4, mit\u00e4 olen tehnyt v\u00e4\u00e4rin, mutta Facebook-feedini on viime aikoina ollut aivan t\u00e4ynn\u00e4 bottien kaapatuilta tai valetileilt\u00e4 postittamaa roskaa. Ensin tuli sadoittain Jennifer Anistonia ja Sandra Bullockia, sitten feikki-intiaania ja nyt viime aikoina aivan loputtomasti lammikossa j\u00e4kitt\u00e4vi\u00e4, teko\u00e4lyn luomia lapsi- ja koiraparkoja sek\u00e4 hurskaita, kuulemma kauniita lentoem\u00e4nti\u00e4. Seassa silloin t\u00e4ll\u00f6in jotain oikeaakin sis\u00e4lt\u00f6\u00e4, mutta tuskaisen v\u00e4h\u00e4n. Suuri virheeni on varmaan ollut skeidan raportointi, jonka algoritmi on tulkinnut mielenkiinnoksi aihetta kohtaan.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><a href=\"http:\/\/www.kameli.net\/marq\/wp-content\/uploads\/2024\/04\/lapsiparka.png\"><img loading=\"lazy\" decoding=\"async\" width=\"526\" height=\"526\" src=\"http:\/\/www.kameli.net\/marq\/wp-content\/uploads\/2024\/04\/lapsiparka.png\" alt=\"\" class=\"wp-image-7777\" srcset=\"http:\/\/www.kameli.net\/marq\/wp-content\/uploads\/2024\/04\/lapsiparka.png 526w, http:\/\/www.kameli.net\/marq\/wp-content\/uploads\/2024\/04\/lapsiparka-300x300.png 300w, http:\/\/www.kameli.net\/marq\/wp-content\/uploads\/2024\/04\/lapsiparka-150x150.png 150w\" sizes=\"auto, (max-width: 526px) 100vw, 526px\" \/><\/a><figcaption class=\"wp-element-caption\">Plesset\u00e4\u00e4n nyt sit\u00e4 peukkua, niin saa terminaattoriressukka korjaamolta paremmat jalat.<\/figcaption><\/figure>\n<\/div>\n\n\n<p>En ole ihan tarkalleen edes perill\u00e4 siit\u00e4, mit\u00e4 n\u00e4ill\u00e4 kaikilla feikeill\u00e4 haetaan. Veikkaisin, ett\u00e4 pornon mainostusta, tilien kaappaamista, hyv\u00e4uskoisten rahojen kuppaamista ja muuta sellaista pyyteet\u00f6nt\u00e4. Internetiss\u00e4 el\u00e4neelle sp\u00e4mmi ja khalastelu ovat tuttu ja arkip\u00e4iv\u00e4inen juttu, mutta mit\u00e4 en ymm\u00e4rr\u00e4 on Facebookin t\u00e4ysi toimettomuus ongelman suhteen. Itse olen pariinkin kertaan joutunut j\u00e4\u00e4hylle ihan normaaleista postauksista, mutta sp\u00e4mmin raportoiminen ei tunnu johtavan yht\u00e4\u00e4n mihink\u00e4\u00e4n. Jos vaivautuisivat filtter\u00f6im\u00e4\u00e4n edes kaiken roskan, jossa on sanat &#8220;beautiful cabin crew&#8221; ja <em>#scarlettjohansson<\/em>, niin k\u00f6k\u00f6n m\u00e4\u00e4r\u00e4 putoaisi murto-osaan. N\u00e4in ei kuitenkaan tapahdu, joten ainoa selitys on, ett\u00e4 Fese <em>haluaa<\/em> tuota j\u00f6\u00f6ti\u00e4 palveluunsa. Dollarit on ep\u00e4ilem\u00e4tt\u00e4 laskettu.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><a href=\"http:\/\/www.kameli.net\/marq\/wp-content\/uploads\/2024\/04\/cabincrew.jpg\"><img loading=\"lazy\" decoding=\"async\" width=\"512\" height=\"512\" src=\"http:\/\/www.kameli.net\/marq\/wp-content\/uploads\/2024\/04\/cabincrew.jpg\" alt=\"\" class=\"wp-image-7778\" srcset=\"http:\/\/www.kameli.net\/marq\/wp-content\/uploads\/2024\/04\/cabincrew.jpg 512w, http:\/\/www.kameli.net\/marq\/wp-content\/uploads\/2024\/04\/cabincrew-300x300.jpg 300w, http:\/\/www.kameli.net\/marq\/wp-content\/uploads\/2024\/04\/cabincrew-150x150.jpg 150w\" sizes=\"auto, (max-width: 512px) 100vw, 512px\" \/><\/a><figcaption class=\"wp-element-caption\">Beautiful cabin crew ja joku n\u00e4ist\u00e4 varmaankin on Scarlett Johansson. Veikkaisin, ett\u00e4 tuossa oikealla.<\/figcaption><\/figure>\n<\/div>\n\n\n<p>Koodarina rupesin miettim\u00e4\u00e4n k\u00e4yt\u00e4nn\u00f6llist\u00e4 algoritmia, joka nappaisi automaattisesti suurimman osan roskasis\u00e4ll\u00f6st\u00e4. Optimoitavia ominaisuuksia ovat ainakin toteutuksen helppous, laskennallinen keveys, pieni muistink\u00e4ytt\u00f6, osumatarkkuus ja skaalautuvuus, sill\u00e4\u00a0onhan k\u00e4sitelt\u00e4v\u00e4 datam\u00e4\u00e4r\u00e4 valtava. Hetken p\u00e4hk\u00e4ilyn j\u00e4lkeen v\u00e4l\u00e4hti ja keksin lupaavan ratkaisun, jonka eri vaiheet n\u00e4ytt\u00e4v\u00e4t t\u00e4lt\u00e4:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Merkitse kaikki uudet postaukset sp\u00e4mmiksi ja poista ne<\/li>\n<\/ol>\n\n\n\n<p>Osumatarkkuus tulee olemaan helposti ainakin 99 %, mit\u00e4 parempaan tuskin pystyv\u00e4t sen enemp\u00e4\u00e4 neuroverkot kuin tilastolliset menetelm\u00e4tk\u00e4\u00e4n. Pienen\u00e4 puutteena hivenen oikeaakin sis\u00e4lt\u00f6\u00e4 saattaa menn\u00e4 mukana, mutta se vaarahan on joka tapauksessa olemassa. Toteutus on lis\u00e4ksi eritt\u00e4in helppo, vaaditun laskentatehon sek\u00e4 muistinkulutuksen suhteen kevyt ja \u2013 mik\u00e4 parasta \u2013 skaalautuu t\u00e4ysin lineaarisesti annetun sy\u00f6tteen mukana O(n). Keksik\u00e4\u00e4p\u00e4 itse parempi!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>En tied\u00e4, mit\u00e4 olen tehnyt v\u00e4\u00e4rin, mutta Facebook-feedini on viime aikoina ollut aivan t\u00e4ynn\u00e4 bottien kaapatuilta tai valetileilt\u00e4 postittamaa roskaa. Ensin tuli sadoittain Jennifer Anistonia ja Sandra Bullockia, sitten feikki-intiaania ja nyt viime aikoina aivan loputtomasti lammikossa j\u00e4kitt\u00e4vi\u00e4, teko\u00e4lyn luomia lapsi- ja koiraparkoja sek\u00e4 hurskaita, kuulemma kauniita lentoem\u00e4nti\u00e4. Seassa silloin t\u00e4ll\u00f6in jotain oikeaakin sis\u00e4lt\u00f6\u00e4, mutta [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,24],"tags":[],"class_list":["post-7775","post","type-post","status-publish","format-standard","hentry","category-uncategorized","category-softat"],"_links":{"self":[{"href":"http:\/\/www.kameli.net\/marq\/index.php?rest_route=\/wp\/v2\/posts\/7775","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/www.kameli.net\/marq\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.kameli.net\/marq\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.kameli.net\/marq\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/www.kameli.net\/marq\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=7775"}],"version-history":[{"count":6,"href":"http:\/\/www.kameli.net\/marq\/index.php?rest_route=\/wp\/v2\/posts\/7775\/revisions"}],"predecessor-version":[{"id":7785,"href":"http:\/\/www.kameli.net\/marq\/index.php?rest_route=\/wp\/v2\/posts\/7775\/revisions\/7785"}],"wp:attachment":[{"href":"http:\/\/www.kameli.net\/marq\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=7775"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.kameli.net\/marq\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=7775"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.kameli.net\/marq\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=7775"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}