Show newer

サーバ再起動したら一部ネットワークが死んでて、なんでだろと思ったら、nftables の設定を間違って保存してたため、nftables 自体が起動してなかった=ルーティングしてない状態だった。
きっと前回ごにょったときに変なタイミングでセーブしたんだと思う。
気をつけよ。

いきなりサーバーかたまった。

今日親指が痛い。なんでかとおもったらもしかして昨日久々にピアノ弾いたからか? サボりすぎたか。
いたい。

HTML 本文、テキスト長ベースで判別すると span 山盛りなサイトでだめか。

fastly.com/jp/blog/summary-of-

HTML の本文抽出って、ステルスゲームを攻略するのに似てる気がしてきた。ちょっと直してはテストして、失敗すると、以前 OK だったやつが NG になったりする。んで、何をやったら両方 OK かを探す感じ。

deno.land つながらん。Docker 内の deno で 毎回ライブラリダウンロードしてるやつが動かない。persistence volume にしとくべきなのかなー

HTML の本文抽出というか、本文を含んでいる要素の抽出をやってる。楽しい。

やり方を知らないものを、trial + error でやるの、どんどんコードがぐっちゃぐちゃになって、わたしだめだ〜、ってなるけど。

HTML の本文抽出試してる。NHK のサイトの HTML がやりづらい。

最後にゴミ掃除するのにクラス名だカスタムデータ属性だ ARIA 属性だは使うかもだけど。

Show thread

Puppeteer がそれなりに動いたようなんで、HTMl の本文っぽいとこを抽出しようとトライ。できればクラス名に頼らずで。
リンクの文字数と、りんくじゃない文字数をゴニョゴニョすると、それなりにとれるてる気がする。

以前はできなかったけど、今はわかる or できる って思えるときは書いてて楽しいー

Show thread

Puppeteer で HTML とるやつ、何度もスクラップ&ビルドしただけあって、最初のよりもだいぶ整理された。
まだ、捕捉できてない場合があるけれど、だいぶよい。

Puppeteer でだめな子、setRequestInterception で image を request.abort() すると、つながるまでリトライするやつがおる。

Puppeteer で上手にとれないとこがおる。goto したときに 例外で net::ERR_FAILED しか吐かんのでどうすっかな。

なんとなくやる気になったので、vm の docker で動かしてるやつを lxc で動かすようにしてみた。 ちょっと様子見。

Firefox 調子悪いなと思ってごにょごにょしてたら、Profile 壊した。しかも、まっさらプロファイルでも不具合直らず。残念。

Ardour とかでコード打ち込むとき microKONTROL だとキーによっては鍵盤数足りんのと、あんま気持ちよく弾けない。かといって、でかいの持ち出すのもしんどい。むー。

Show older
Mastodon

The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!