Speech to Text
音声文字起こしAI

専門用語に強い
音声認識AI
業界大手の1/3の価格

医療・法務・金融の専門用語をAIが自動補正。
Python、Node.js、ブラウザから3行で組み込めます。

from genshi_stt import GenshiSTTClient

async with GenshiSTTClient(api_key="gw-...") as client:
    result = await client.transcribe(audio)
    print(result.text)
# => "閉鎖孔ヘルニアの疑いで緊急入院"
GENSHI Works コンソール
¥50/h〜 業界最安水準
1/3 大手比コスト
AI補正 専門用語を自動修正
2 SDK Python / Node.js
AI CORRECTION

一般的な文字起こしが崩す専門用語を、
AIが自動で補正。

音声認識の結果をAIが文脈と辞書から自動修正。
医療・法務・金融の専門用語に対応しています。

Medical
Raw STT閉鎖コーヘルニア
AI補正後閉鎖孔ヘルニア
Raw STT内視鏡的逆行性短観造影
AI補正後内視鏡的逆行性胆管膵管造影
Raw STTカントン
AI補正後嵌頓
FEATURES

なぜ GENSHI Works なのか

業界大手の 1/3 の価格

大手音声認識サービスが ¥150〜220/h のところ、GENSHI は ¥50/h から。
Secureティアでも ¥80/h。
AI補正込みでこの価格です。

GENSHI Standard
¥50/h
GENSHI Secure
¥80/h
業界大手(医療向け)
¥150〜220/h

3行で組み込めるSDK

Python / Node.js SDK。
APIキーを渡すだけで、音声ファイルもすぐに文字起こしできます。

pip install genshiai-stt npm i @genshiai/stt

Workspace管理

組織・チーム管理。
プロジェクト分離、ロールベースアクセス制御、APIキーの権限設定まで。

Secureティア

国内処理・データ国内完結。
医療・法務など機密性の高いワークロード向け。
情報システム部門への説明もしやすい設計です。

Batch & Realtime

録音ファイルの一括処理も、マイクからのリアルタイム文字起こしも同じSDKで。

カスタム辞書

社名・製品名・社内略語を部署ごとに登録。
医療/法務/金融のプリセット辞書も用意。
APIとConsoleから管理。

SDK

開発者体験を最優先に設計

APIキーひとつで、バッチ処理もリアルタイム文字起こしも。
専門用語のAI補正、カスタム辞書まで全て含まれています。

transcribe.py
from genshi_stt import GenshiSTTClient

# バッチ文字起こし
async with GenshiSTTClient(api_key="gw-...") as client:
    result = await client.transcribe("recording.wav")
    print(result.text)
    # => "閉鎖孔ヘルニアの疑いで緊急入院"

# リアルタイム文字起こし
async with GenshiSTTClient(api_key="gw-...") as client:
    async with client.stream(
        domain="medical",
        secure=True,
    ) as session:
        events = await session.push(audio_chunk)
        print(events[0].text)

        final = await session.finalize()
        print(final.text)

Batch & Realtime

録音ファイルの一括処理も、マイクからのリアルタイム文字起こしも同じSDKで。

専門用語AI補正

医療・法務・金融の専門用語をAIが自動で修正。
カスタム辞書にも対応。

🔒

Secureティア対応

国内処理・データ国内完結が必要なケースに。
Growth以上のプランで利用可能。

📦

マルチプラットフォーム

macOS / Linux / Windows。
Python、Node.js の2 SDKに対応。

Python pip install genshiai-stt
JavaScript npm install @genshiai/stt
CONSOLE

Webコンソールで全てを管理

APIキー発行、課金管理、使用量モニタリング、辞書設定、チームメンバー管理まで。

GENSHI Works Console

APIキー管理

スコープ設定、有効期限、処理ティア選択

Workspace & チーム

WorkOSベースの組織管理とロール制御

課金・ポイント

Stripe連携。
プラン選択・ポイント購入・利用履歴

辞書管理

カスタム辞書 + 業界プリセットをGUIで操作

Playground

ブラウザ上でAPIリクエストを即時テスト

使用量モニタリング

日別・キー別の使用量とコスト可視化

OPTIONS

3つの軸で料金が決まります

ドメイン × 処理モード × ティアの組み合わせで、1時間あたりの消費ポイントが変わります。

1

認識対象ドメイン

  • 一般 — General

    一般会話・ビジネス向け。
    日常的な音声を高精度に文字起こし。

  • 業界特化 — Industry

    医療・法務・金融など業界別に最適化。
    専門用語のプリセット辞書が適用されます。

  • 独自辞書 — Custom

    社名・製品名・社内略語などを登録して独自の用語に対応。

2

処理モード使い方

  • 一括処理 — Batch

    録音ファイルをまとめて文字起こし。
    会議・面談・通話の記録に。

  • リアルタイム — Realtime

    マイクからのライブ文字起こし。
    通話中・面談中にリアルタイムで変換。

3

セキュリティ処理ティア

  • 通常処理 — Standard

    高速・低コスト。
    多くのユースケースに最適です。

  • 国内処理 — Secure

    データ国内完結。
    3省2ガイドライン対応。
    Growth以上のプランで利用可能。

PRICING

シンプルなポイント制

無料枠60分付き!
クレカ不要で今すぐ始められます。プラン契約で最大20%割引。

ポイント消費レート(1時間あたり)
一般
業界特化
独自辞書
通常 × 一括
5pt ¥50/h
7pt ¥70/h
10pt ¥100/h
通常 × リアルタイム
10pt ¥100/h
14pt ¥140/h
20pt ¥200/h
国内処理 × 一括
10pt ¥100/h
13pt ¥130/h
国内処理 × リアルタイム
20pt ¥200/h
26pt ¥260/h
Free
¥0
60pt 付与(30日間)
クレカ不要
  • Playground / Web App
  • Standard ティア
  • General / Industry ドメイン
  • Secure ティア
  • API キー発行
無料で試す
Starter
¥1,980/月
220pt / 月
10%お得(¥9.0/pt)
  • 全チャネル利用可
  • Standard ティア
  • 全ドメイン対応
  • メールサポート
  • Secure ティア
プランを選ぶ
Business
¥14,800/月
1,850pt / 月
20%お得(¥8.0/pt)
  • 全チャネル利用可
  • Standard + Secure ティア
  • 全ドメイン対応
  • 優先サポート
  • 国内処理対応
プランを選ぶ

都度購入(PAYG)は ¥10/pt でいつでも追加可能。
Enterprise は要件に応じて個別設計 → お問い合わせ

HOW IT WORKS

5分で始められます

01

アカウント作成

メールアドレスで無料登録。
60ptが即時付与されます。

02

APIキー発行

Consoleからキーを発行。
スコープとティアを選択。

03

SDKをインストール

pip install genshiai-stt
3行で文字起こし開始。

04

本番展開

プランを選んでスケール。
Workspaceでチーム管理。

CASE STUDIES

導入イメージ

医療現場
Medical

診療記録の作成時間を 65% 短縮

医療辞書を適用。
専門用語をAIが自動補正し、医師の確認工数を大幅削減。
Secureティアで院内セキュリティ要件にも対応。

北央メディカル ・ 420名

金融オフィス
Financial

面談メモ共有を当日中に標準化

リアルタイムストリーミングで面談中に文字起こし。
カスタム辞書で金融商品名を登録し、後処理工数を削減。

NexTrust Financial ・ 160名

コンタクトセンター
Contact Center

応対後処理時間を 32% 削減

通話録音をバッチで一括投入。
¥50/hからの料金で運用コストを大手の1/3に抑えながら品質を維持。

Aster Support ・ 900名

TRY IT

ブラウザで試す

アカウント不要で文字起こしの精度を検証できます。

Speech to Text
OCR
Idle
00:30

最大30秒の録音またはファイルアップロード

文字起こし結果

ここに結果が表示されます...
Idle

画像またはPDFをドラッグ&ドロップ

または

プレビューなし

抽出テキスト

ここに結果が表示されます...
FAQ

よくある質問

病院・クリニックで使えますか?
はい。
医療分野向けのプリセット辞書(医療用語、薬剤名、検査名等)を標準で提供しています。
Secureティアでは3省2ガイドライン等の医療情報セキュリティ要件にも対応しており、院内の情報システム部門への説明もしやすい設計です。
診療記録の作成、カンファレンスの記録、面談のメモ作成などでご利用いただいています。
医療以外の専門分野には対応していますか?
はい。
医療に加えて、法務(契約書レビュー、法廷記録)、金融(面談記録、コンプライアンス対応)、不動産、建設、物流、教育、行政など幅広い業界のプリセット辞書を用意しています。
さらにカスタム辞書で社内独自の用語にも対応可能です。
料金はどのくらいかかりますか?
ポイント制で、使った分だけお支払いいただくシンプルな料金体系です。

まずは無料で試せます:60ポイント付与(約12時間分)、クレジットカード不要。

月額プラン(ポイントが割引に):
・Starter — ¥1,980/月(220pt付き、10%お得)
・Growth — ¥4,800/月(560pt付き、15%お得、Secure対応)
・Business — ¥14,800/月(1,850pt付き、20%お得)
・Enterprise — 要件に応じて個別設計

消費ポイントは認識対象・処理モード・ティアの組み合わせで異なります。最安は一般 × 一括処理で ¥50/時間 です。
SDKはどのプラットフォームに対応していますか?
Python と JavaScript/Node.js の SDK を提供しています。macOS・Linux・Windows に対応。
APIキーひとつで、バッチ処理もリアルタイム文字起こしもすぐに始められます。
リアルタイムとバッチはどう使い分けますか?
リアルタイムは通話中・面談中のライブ文字起こしに、バッチは録音ファイルの一括処理に向いています。
どちらも同じSDKから利用でき、用途に応じて使い分けられます。
カスタム辞書はどう使いますか?
Webコンソールの画面から辞書を作成し、APIキーに紐付けます。
用語・読み・別名を登録でき、部署や用途ごとに辞書を分けて管理できます。
医療・法務・金融などのプリセット辞書もすぐに利用可能です。
Secureティアでは何が変わりますか?
Secureティアでは、データの国内処理・国内完結を保証します。
3省2ガイドライン等の医療情報セキュリティ要件に対応しており、情報システム部門への説明にも使いやすい設計です。
Growth以上のプランでご利用いただけます。
チームや組織で使えますか?
はい。
Workspace(組織)単位でメンバー管理、プロジェクト分離、APIキーの権限設定ができます。
管理者と一般メンバーの役割を分けて運用でき、部署ごとに辞書やキーを分けることも可能です。
自社システムへの組み込み開発を依頼できますか?
はい。
Enterpriseプランでは、お客様のシステムへの組み込み支援やカスタマイズ開発にも対応しています。
既存の業務システム、電子カルテ、CRM等との連携もご相談いただけます。
まずはお問い合わせフォームからご連絡ください。
無料で試すにはどうすればいいですか?
「無料で始める」ボタンからアカウントを作成するだけです。
クレジットカード不要で、60ポイント(約12時間分の文字起こし)がすぐに付与されます。
コンソールからAPIキーを発行し、SDKをインストールすれば数分で文字起こしを開始できます。
CONTACT

お問い合わせ

導入相談、Enterprise プラン、技術的なご質問など、お気軽にご連絡ください。

通常1営業日以内にご返信いたします。

メールでのお問い合わせ

contact@genshi.ai

サポート

Free / Starter: コミュニティ

Growth: メールサポート

Business: 優先サポート

Enterprise: 専任サポート

SDK

SDK / APIの使い方はコンソールのAPIキー発行後にご利用いただけます。

コンソールへ →

今すぐ無料で始める

60ポイント付与・クレカ不要。
5分でAPIキーを取得し、SDKから文字起こしを開始できます。