HTML の本文抽出というか、本文を含んでいる要素の抽出をやってる。楽しい。
やり方を知らないものを、trial + error でやるの、どんどんコードがぐっちゃぐちゃになって、わたしだめだ〜、ってなるけど。
Plamo も長いなーすごいなー
https://gihyo.jp/lifestyle/serial/01/ganshiki-soushi-2/0040
HTML の本文抽出試してる。NHK のサイトの HTML がやりづらい。
最後にゴミ掃除するのにクラス名だカスタムデータ属性だ ARIA 属性だは使うかもだけど。
Puppeteer がそれなりに動いたようなんで、HTMl の本文っぽいとこを抽出しようとトライ。できればクラス名に頼らずで。リンクの文字数と、りんくじゃない文字数をゴニョゴニョすると、それなりにとれるてる気がする。
以前はできなかったけど、今はわかる or できる って思えるときは書いてて楽しいー
Puppeteer で HTML とるやつ、何度もスクラップ&ビルドしただけあって、最初のよりもだいぶ整理された。まだ、捕捉できてない場合があるけれど、だいぶよい。
Puppeteer でだめな子、setRequestInterception で image を request.abort() すると、つながるまでリトライするやつがおる。
Puppeteer で上手にとれないとこがおる。goto したときに 例外で net::ERR_FAILED しか吐かんのでどうすっかな。
なんとなくやる気になったので、vm の docker で動かしてるやつを lxc で動かすようにしてみた。 ちょっと様子見。
Firefox 調子悪いなと思ってごにょごにょしてたら、Profile 壊した。しかも、まっさらプロファイルでも不具合直らず。残念。
Ardour とかでコード打ち込むとき microKONTROL だとキーによっては鍵盤数足りんのと、あんま気持ちよく弾けない。かといって、でかいの持ち出すのもしんどい。むー。
ArchLinux でほったらかしといた Jack を鳴るようにしたので、MicroKontrol つなげてシーケンサ動かしてみた。うちの PC だと Zrythm はもっさりで落ちてだめで、Ardour6 はたまに死ぬけど、Ardour6 + Cardinal で遊べた。modular シンセわからんけど楽しい。
88x31 懐かしいサイズだ。https://cyber.dabamos.de/88x31/index.html
見切り品果物と牛乳とマシュマロでアイスっぽいものを作ってみるテスト。うまくできるかしら。
ストリームを combine して sampledBy して map して また sampledBy してってなってる。
自分の変数名の付け方が腐ってるので、なんとかしたい。
今日は、さぼってたピアノ弾いて FitBoxing2 やって、ができたので偉いことにする。
くたばる前にいろんな写真レタッチしなおしてネットにあげておきたいとふとおもった。だいたい、そういうときって、どう写真ファイル管理するか?ってのに頭が向いて全然すすまないんだよなーわたし。
https://www.youtube.com/watch?v=WW7IDG2dkBM
最近甘いもん食べたくなるんだよなー。少しずつ戻さねば!
The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!