「フォントピント」が縦書き・複数行のテキストに対応しました

画像から日本語フォントを検索できる唯一のサービス「フォントピント」が、縦書きや複数行のテキストに対応しました！より柔軟にフォントの検索が可能になりました。あとちょっぴり精度が良くなったはずです。検索のための内部の方法が大きく変わったので、…

2022-04-22

「フォントピント」がadobe fontsの日本語フォントに対応しました（＋検索にかかる時間が大幅に短くなりました）

画像から日本語フォントを検索できるサービス「フォントピント」が、adobe fontsが提供する日本語フォントに対応しました。今まではgoogle fontsが提供する日本語フォントだけが検索対象でしたが、adobe fontsが加わったことで大幅に対応フォント数が増えて…

2022-04-12

画像から日本語フォントを検索できるサイト「フォントピント」を作った

こんにちは、街中で「あの文字のフォント何なんだろう？」と思うことよくありますよね。そんなときに役立つサイト「フォントピント（β）」を作りました。 fontpint.com 実際のところ、フォント関連で何か作りたいなと思ってフォント関連の論文を漁っていたと…

2022-03-03

Next.jsのISRとGASでサクッとプライベートを晒す

↓作ったものはこちらぼくのクラシルお気に入りレシピこんにちは、最近個人的にNext.jsを使っているのですが、ISR (Incremental Static Regeneration) の機能を使う機会がありませんでした。ISRは一度アプリケーションをビルドした後も特定のページを定期的…

2022-02-22

『INTP型自分の取扱説明書』で自分と向き合う

最近Kindle Unlimitedで気になった本を読んでいるのだが、その中でも『INTP型自分の取扱説明書』という本が気になって読んだ。 MBTIにおける16の分類のうちの1つであるINTP型に対する解説書だ。『The INTP Personality Careers Relationships & the Quest fo…

2022-02-09

占いのキュレーションサービス「Ftune」を作った

こんにちは、突然ですが僕たち日本人にとって空気のように身近にあるものといえば何でしょうか？それはもちろん「占い」です。朝の情報番組にはほぼ確実に占いのコーナーがあり、僕たちはそれを何の疑いもなく享受しています。ニュースと占いは2つが合わさっ…

2022-01-23

羊文学の「光るとき」は世界の美しさを説明した初めての曲なんじゃないか？

去年から羊文学にはまっている。そして今年に入って待ちに待った「光るとき」の配信が始まったので聴いている。何回か聴いているとスッと体の中に入ってくるフレーズがある。サビの「何回だっていうよ世界は美しいよ君がそれを諦めないからだよ」というと…

#羊文学 #光るとき

2021-07-02

Istio で gRPC サービスの AB テスト基盤っぽいものを作ってみる

Kubernetes Istio gRPC

機械学習を用いたサービスを開発する際、推論用の API サーバを立ててリクエストを受ける構成が多いと思います。モデルを改良したときには、全てのリクエストを新しいモデルをサービングする API に渡すわけではなく、トラフィックを分散して AB テストを行…

#Kubernetes #istio #gRPC

2020-05-24

ここ半年くらいを振り返る

現職に転職して半年くらいが経ちこれまで経験してないことを結構やった気がするので、備忘録として残しておきます。（誰かが記憶と記録が大事と言っていた気がするので） 11月〜1月ここらへんの時期は社内の開発環境に慣れるためもあり、あるプロダクトで上…

2020-01-21

はてなブログのブックマーク数を予測するwebアプリを作った

タイトルのとおり、はてなブログの記事の内容からはてなブックマーク数（はてブ数）を予測するwebアプリを作りました。 ※追記: コストが増加してきたので一旦サービスを止めています… 以下では背景や方法、システムの概要や今後の展望について説明します。 …

2019-12-22

人生のステージに応じた壁と井口祐未

これは SHIROBAKO Advent Calendar 2019 22 日目の記事です。 SHIROBAKO とは一体何なのか。この問いに対して 10日目の記事では、「辿り着きたい場所」に向かっていく物語という一つの仮説にたどり着いていました。答えは無数にありそうですが、それを抽…

2019-09-10

WebDB Forum 2019で技術報告しました

9月8日〜9日で開催されたWebDB Forum 2019に、スポンサー企業の技術報告という形で登壇しました。 db-event.jpn.org 8日の夜から9日の早朝にかけて台風15号が直撃するというまさかの展開を迎えましたが、柔軟なスケジュール変更で予定されていた全てのセッシ…

2019-08-09

Wikipediaを活用した表記ゆれへの対応

自然言語処理 Wikipedia

自然言語処理のタスクにおいて、表記ゆれの問題が常につきまといます。単純なパターンであれば単純なルールで対処が可能です。例えばアルファベットの大文字・小文字の混在であれば全て小文字に変換すれば良いし、半角文字と全角文字の混在であれば全て全角…

2019-07-22

ダウンサンプリングによる予測確率のバイアス

Python 不均衡データ機械学習

機械学習（二値分類問題を考えます）において不均衡なデータセット（クラス間でサンプルサイズが大きく異なる）を扱う場合、多数派のクラスのサンプルに対してサンプリング行い均衡なデータセットに変換するダウンサンプリングが良く行われます。この不均衡…

2019-07-15

滝沢カレンを作る技術

機械学習 Deep Learning 言語モデル滝沢カレン文書生成

滝沢カレン（以下、敬称略）をご存知でしょうか。ファッション雑誌『JJ』専属モデルであり、モデルやタレントとして活躍されています。*1 そんな彼女の書く文章は非常に豊かな表現で構成されており、一部では純文学とも評されています。近年、彼女の文章を…

2019-06-30

【論文紹介】Deep Interest Network for Click-Through Rate Prediction

機械学習論文 CTR予測 Deep Learning Embedding

今回は、KDD 2018で発表されたCTR (Click Through Rate) 予測に関する論文 Deep Interest Network for Click-Through Rate Prediction を紹介したいと思います。CTR予測は、広義では注目している行動を起こす確率予測であるので、レコメンドに関する論文と捉…

2019-05-23

LDAを用いたカテゴリ変数からの特徴抽出

機械学習カテゴリ変数 LDA

kaggleのTalkingData AdTracking Fraud Detection Challengeで1位になったチームの解法の1つである、トピックモデルを用いたカテゴリからの特徴抽出を試してみたので紹介します。 Pythonでの実装はこちらです。 github.com 概要参考にしたのは、kaggleでの…

2019-04-11

機械学習の実用的な評価値チートシート

機械学習評価値

機械学習の評価値として、Accuracy/Precision/Recall/F1などが教科書にも載っており、最も有名な評価値だと思います。ただ実産業への応用において、これらの評価値では正しくモデルの性能を評価できないことが多く、多くの機械学習エンジニアやデータサイエ…

2019-03-25

カテゴリ変数の分散表現を学習するEntity Embeddingの実装

Python 機械学習カテゴリ変数 Embedding

機械学習においてカテゴリ変数を扱うとき、何らかの変換を施して任意の数値で表現しなければなりません。今回はWord2Vecのように任意のカテゴリ変数の分散表現を学習する、Entity Embeddingの紹介とそのPythonの実装をライブラリとして公開したので紹介しま…

2018-11-25

Hugoでポートフォリオサイトみたいなものを作ってGitHub Pagesで公開した

Hugo GitHub-pages

最近アウトプットを増やしたいという思いがあり、とりあえず形からでもと思ってポートフォリオサイトっぽいものを作ろうと思いました。どうやって作ろうかと思っていた中で、何となく知っていたHugoとかSphinxみたいな単語で調べてみると、そもそも静的サイ…

2018-10-20

PyData.tokyo One-day Conference 2018に参加した

python 機械学習 PyData

PyData.tokyo One-day Conference 2018に参加したので、メモ書きを記載する。 pydatatokyo.connpass.com なお自分の記憶のためのメモなので、内容の正確さは保証できません。 PyData.Tokyo データ分析のための Python パフォーマンスチューニングテクニック …