売り上げがなくてPA-APIが使えなかったので、HTMLから抜き出すようにしてみた。
とりあえずKindleのASINから取り出してフロントマターに書き出した。
抽出にはPuerkitoBio/goquery: A little like that j-thing, only in Go.を使っている。
Kindle以外はあまり試していないが、うまく取れない商品があることは認識している。
あと、著者のところが謎な構成になっていて、span.author.notFaded
の直下にある場合と、もう一段span
が入っている場合があった。
直下にある方を先に処理しているので、ものによってはWebでの見た目の順番と入れ替わってしまう場合がある。