サーバ再起動したら一部ネットワークが死んでて、なんでだろと思ったら、nftables の設定を間違って保存してたため、nftables 自体が起動してなかった=ルーティングしてない状態だった。きっと前回ごにょったときに変なタイミングでセーブしたんだと思う。気をつけよ。
いきなりサーバーかたまった。
Bunny Fonts なんてのがあったのか。知らなかった。ゼロトラッキング+ノーログ。
via https://text.baldanders.info/remark/2022/06/migrate-to-bunny-fonts-from-google-fonts/
https://gigazine.net/news/20220622-bunny-fonts/
https://fonts.bunny.net/
今日親指が痛い。なんでかとおもったらもしかして昨日久々にピアノ弾いたからか? サボりすぎたか。いたい。
HTML 本文、テキスト長ベースで判別すると span 山盛りなサイトでだめか。
https://www.fastly.com/jp/blog/summary-of-june-8-outage
HTML の本文抽出って、ステルスゲームを攻略するのに似てる気がしてきた。ちょっと直してはテストして、失敗すると、以前 OK だったやつが NG になったりする。んで、何をやったら両方 OK かを探す感じ。
deno.land 帰ってきた。
deno.land つながらん。Docker 内の deno で 毎回ライブラリダウンロードしてるやつが動かない。persistence volume にしとくべきなのかなー
HTML の本文抽出というか、本文を含んでいる要素の抽出をやってる。楽しい。
やり方を知らないものを、trial + error でやるの、どんどんコードがぐっちゃぐちゃになって、わたしだめだ〜、ってなるけど。
Plamo も長いなーすごいなー
https://gihyo.jp/lifestyle/serial/01/ganshiki-soushi-2/0040
HTML の本文抽出試してる。NHK のサイトの HTML がやりづらい。
最後にゴミ掃除するのにクラス名だカスタムデータ属性だ ARIA 属性だは使うかもだけど。
Puppeteer がそれなりに動いたようなんで、HTMl の本文っぽいとこを抽出しようとトライ。できればクラス名に頼らずで。リンクの文字数と、りんくじゃない文字数をゴニョゴニョすると、それなりにとれるてる気がする。
以前はできなかったけど、今はわかる or できる って思えるときは書いてて楽しいー
Puppeteer で HTML とるやつ、何度もスクラップ&ビルドしただけあって、最初のよりもだいぶ整理された。まだ、捕捉できてない場合があるけれど、だいぶよい。
Puppeteer でだめな子、setRequestInterception で image を request.abort() すると、つながるまでリトライするやつがおる。
Puppeteer で上手にとれないとこがおる。goto したときに 例外で net::ERR_FAILED しか吐かんのでどうすっかな。
なんとなくやる気になったので、vm の docker で動かしてるやつを lxc で動かすようにしてみた。 ちょっと様子見。
Firefox 調子悪いなと思ってごにょごにょしてたら、Profile 壊した。しかも、まっさらプロファイルでも不具合直らず。残念。
Ardour とかでコード打ち込むとき microKONTROL だとキーによっては鍵盤数足りんのと、あんま気持ちよく弾けない。かといって、でかいの持ち出すのもしんどい。むー。
The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!