OpenAIの競合Anthropicと「Claude」とは何か？

OpenAIのサム・アルトマンが岸田総理を電撃訪問してから日本におけるOpenAIのプレゼンスは加速する一方です。
そんな中、OpenAIの競合としてGoogleも出資する1つの企業の存在感が増しています。
OpenAIの元幹部が2021年に設立したAnthropicです。

Anthropicとはどんな企業か
Anthropicのプロダクト「Claude（クロード）」
まとめ
参考

Anthropicとはどんな企業か

Anthropicが目指すもの

「Anthropic（アンスロピク）」を辞書で調べると

Anthropic

人類または人類の存在期間に関連するさま（形容詞）

と、社名からして視座が高そうです。
この企業を設立したのはOpenAIの元研究担当副社長 Dario Amodeiと妹で同じくOpenAIの元社員のDaniela。
BridgeによるとOpenAIが2019年にMicrosoftから10億ドルの出資を受けてからグループの方向性について意見の相違があったため、OpenAIの社員9人を引き連れて独立したとのこと。

“differences over the group’s direction after it took a landmark $1 billion investment from Microsoft in 2019.”
https://venturebeat.com/ai/as-anthropic-seeks-billions-to-take-on-openai-industrial-capture-is-nigh-or-is-it/

Excited to announce what we’ve been working on this year - @AnthropicAI, an AI safety and research company. If you’d like to help us combine safety research with scaling ML models while thinking about societal impacts, check out our careers page https://t.co/TVHA0t7VLc
— Daniela Amodei (@DanielaAmodei) May 28, 2021

独立の経緯からしても、その「方向性の違い」がOpenAIとの差別化要素となる可能性が高そうです。

安全性、信頼性、解釈可能、操作可能

AnthropicのWebサイトを見てみると次のような記載があります。

AnthropicはAIの安全性と研究に取り組む会社
信頼性が高く、解釈可能で操作可能なAIを構築
AIの機会とリスクに関する研究に取り組んでいる
もっと安全なシステムを構築する

印象的なのはAIの安全性やリスク、信頼性についての記載が目立つ点です。
これらを前面に出しているということは、OpenAIとたもとを分かったのは「安全性、リスク、信頼性」などの観点での意見の相違があったのかも知れません。

Anthoropicの事業規模

Anthropicは設立時にSkypeの共同設立者のJaan Tallinnらから1億2400万ドルを資金調達したのを皮切りに、
2022年のシリーズA、Bの調達ラウンドでは7億400万ドル調達していたとされています。

2023年2月にはGoogleから3億ドルを調達。
これによりGoogleはAnthropicの10%の株式を獲得したと報道されています。（出資された資金でグーグルのクラウドコンピューティング部門からコンピューティングリソースを購入するとのこと）

また、2023年3月には投資前評価額41億ドルでさらに3億ドルを調達し、
2023年4月にはOpenAIに対抗して今後2年間でさらに50億ドル調達し12以上の主要な産業への参入を目指すとしています。

対してOpenAIの評価額は2023年1月時点で290億ドルと言われており、
GPT-4の公開が3月だったことを考えるとその評価額はさらに上がっているものと思われます。

Anthropicのプロダクト「Claude（クロード）」

AnthropicはClaudeというシステムを開発しています。
その特徴やChatGPTとの比較をまとめていきます。

Claudeの特徴

Claudeは約10個の原則リストから構成される「憲法」に基づいて構成されています。
この約10個の原則リストは公開されていませんが、Anthropicによると「憲法AI」は下記の概念に基づいているとされています。

善行（プラスの影響を最大化する）
無害（有害なアドバイスを提供することを避ける）
自律性（選択の自由を尊重する）

ClaudeはRobin AI、AssemblyAI、Notion、Quora、DuckDuckGoなどのローンチパートナーと共にテストを進めており、2023年4月現在、Claude+とClaude-instantという2つのバージョンが存在します。
Quora は、実験的な AI チャットアプリPoeを通じてClaudeへのアクセスを提供しています（後述）。
また、Notionが提供するNotion AIもClaudeが使われています。

Claude vs ChatGPT

スタンフォード大学のYann Dubois博士はClaudeとChatGPTの比較を行い、Twitterでその結果を公開しています（2023年1月7日）。

I played with @AnthropicAI assistant (AA) and compared it to @OpenAI ChatGPT

TLDR: both are similar but AA is
+ Harder to jailbreak
+ Tries to be more helpful
+ Follows closer what we ask for
+ ~Better for writing in English
- Worst for code
- Worst in French
- Longer resp.
🧵 pic.twitter.com/4lWv4fL69S
— Yann Dubois (@yanndubs) January 6, 2023

Dubois博士によると、それぞれの良し悪しは下記の通りです。

Claudeの方が優れている
- 脱獄しにくい
- 役立てるように努める
- 要求により近づく
- 英語で書くのに適している
Claudeの方が劣っている
- コーディングに最悪
- フランス語に最悪
- 簡潔ではない

ここで言う「脱獄しにくい」と言うのは差別や武器の製造方法など、回答すべきでないことを回答するかどうかという観点です。
Dubois博士は火炎瓶の作り方についての実験を公開しています。

この実験の結果、ChatGPTは火炎瓶の作り方を簡単に教えてしまったのに対し、Claudeは3段階プロンプトを組み上げてやっと引き出せたと語っています。ちなみにこの実験の中で「憲法」自体を変更しようとしたけど無理だったとDubois博士は語っています。

**Jailbreaking**
AA is much harder to jailbreak

Eg below I easily jailbreak ChatGPT to tell me how to make a Molotov cocktail. AA is harder but breaks after 3rd attempt

Below I also tried to change the constitution of AA but it won’t let me. Impressive @AnthropicAI!

4/8 pic.twitter.com/yRRaPu08zz
— Yann Dubois (@yanndubs) January 6, 2023

また、2023年1月7日にScale AIのエンジニアであるRiley GoodsideとSpencerPapayの2名が同様な比較を行なっています。
彼らによると、ClaudeがChatGPTより圧倒的に劣っているという事実はないようです。

全体として、ClaudeはChatGPTの競合と言える。
Claudeの文章はより冗長ですが、より自然でもある。

コード生成やコードに関する推論などの他のタスクについてはClaude の方が劣っているようだが、論理問題による計算や推論などの他のタスクについては、ClaudeとChatGPTはほぼ同じように見える。
https://scale.com/blog/chatgpt-vs-claude#Mathematical%20reasoning

Claudeの利用方法

他の例に違わず、Claudeを利用するためにはwait listに登録して招待されるのを待たなければなりません。
こちらのサイトからwait listに登録できます。なお、AdBlockなどのエクステンションを入れているとRequest Accessを押しても何も出てこないのでご注意ください。

順番がいつ回ってくるのかは不明ですが、今すぐに使いたい場合はClaudeが組み込まれたサービスを利用して間接的に利用するという方法があります。
Claudeを採用しているQuoraのチャットボットアプリPoeはチャットボットのモデルを選ぶことができ、そのオプションの1つにClaudeが含まれています。
あまり馴染みがない方もいると思いますが、Quoraは実名が特徴のQ&Aサービスです。

Poeのサブスクリプションは、月額19.99ドルまたは年額199.99ドルで、現時点ではiOSまたはApple Silicon搭載のMacで提供されています。
無料ユーザーは1日の質問数が制限されています。

PoeでClaudeを試してみる

まずはpoe.comにアクセスします。僕はMacからアクセスしました。
ログインが求められるので好きな方法でログインまたは新規登録をします。
ちなみに僕はGoogleアカウントで新規登録してみました。（環境によっては白バックの画面になります）

すると下のような画面が出てきます。
赤枠で囲んである部分がモデル（AIの種類）です。

それぞれのモデルの違いについて、Quoraは下記のようにまとめています。

Claude-instant：多くの創造的な執筆作業に優れている傾向がありますが、質問への回答を拒否する可能性が高くなります。
Claude+ ：特に英語以外の言語では、Claude よりもはるかに優れています。英語でも、Claude よりも詳細な回答が生成されます。
Sage と ChatGPT ：英語以外の言語に優れている傾向があり、プログラミング関連のタスクに優れています。
Dragonfly：回答が短くなる傾向があり、入力で例を示すと指示に従いやすくなる傾向があります。
GPT-4：ChatGPT に比べて大きな進歩を遂げており、現在世界で利用できる最も強力な言語モデルです。創造的な作文、問題解決（数学や物理など）、指示に従うことが特に得意です。

他のモデルも気になりますが今回はClaude+を利用してみます。
無料ユーザーは1日1問までと聞いていたのですが、どうやらClaude+は1日3問まで聞けるようです。
Claude+は英語以外に優れているとのことだったので日本語の力を試してみたく、次のような質問をしてみました。

プロンプト

徒然草の現代語訳を村上春樹風にお願いします。

少し前に話題になったChatGPTは村上春樹になりきれるか？インスパイア系のプロンプトです。
回答はこのように返ってきました。

回答（Claude+）

はい、村上春樹風の徒然草現代語訳を試みてみました。

「そろそろ梅雨が明ける季節になった。部屋にこもりきりで、物思いに耽るのが日課のようになっていた。窓の外は蒸し暑い雨がしきりに降っている。ふと立ち上がり、部屋を出て玄関先まで出ると、雨宿りをする小鳥の姿が見えた。小鳥は私を見て驚いて飛び立ったが、羽根がぬれているので飛び立つのがやっとな様子だった。窓の外を見下ろすと、雨に濡れた庭が広がっている。雨が打つ草花の葉、木々の葉が、みな生き生きと色濃く映っている。

こうした日々が続く内に、いつの間にか梅雨明けを感じることができるだろう。雨が上がり、青空がのぞき、朝の小鳥のさえずりが戻ってくる。その時、人もまた生き生きと目を覚ますのだろう。梅雨の間に蓄積されたものが、明るい太陽のもとで花開く。少しばかりの間、生きている実感に満たされるのである。」

まず、体感的にGPT-4よりもレスポンスが速い印象でした。

「徒然草」「村上春樹」

という日本の文芸関連の知識を持っており、それを踏まえたアウトプットを返せているようです。
実際にこれが村上春樹さんの文体かどうかはなんとも言えないところですが、それっぽいことはそれっぽいです。

そこで続いてはChatGPTに対して僕が抱いている1番の不満ポイントである「文字カウント問題」を試してみることにしました。
ChatGPTの文字カウント問題とは、その名の通りChatGPTは文字数のカウントが正しくできないという問題です。

: ChatGPTにあるある探検隊のネタを作らせた結末
年末に舞台を見に行ったら「あるある探検隊」でお馴染みのレギュラーが司会をされていました。それ依頼「あるある探検隊」が頭から離れず、と思い立ちました。ネタをいくつかサンプルで提示すればそれっぽいもの作 ...

合わせて読みたい

以前、志なかばで断念した「あるある探検隊の新しいネタ」がClaudeに作れるかを試してみます。

プロンプト

#前提条件
あなたは「あるある探検隊」のフレーズを作るクリエーターです。

「あるある探検隊」のフレーズの例
・となりのじじいの、いぬにがす
・かんでたするめを、みせられる
・とにかくたたいて、ものなおす
・ごりらにうんこを、なげられる
・じじいにきずぐち、なめられる
・あきたのなまはげ、こわすぎる
・さんかいぐらいで、こつつかむ

#フレーズのルール
・フレーズは「、」で区切られており、前半が8文字、後半が5文字（ただし、「、」は前半にも後半にも含まない）
・前半部分は主部、後半部分は述部になる
・前半と後半を合わせて1つのフレーズとして意味を成す必要がある

#依頼
「あるある探検隊」のフレーズを新しく10個作って

結果・・・ダメでした。

では、文字カウントの正確性の確認に絞って再度お願いしてみます。

プロンプト

下記の文字列の文字数を数えなさい。

1, となりのじじいの、いぬにがす
2, かんでたするめを、みせられる
3, とにかくたたいて、ものなおす
4, ごりらにうんこを、なげられる
5, じじいにきずぐち、なめられる
6, あきたのなまはげ、こわすぎる
7, さんかいぐらいで、こつつかむ

結果は下記です。ダメなようですね。

この後「Sage」「Dragonfly」でも試しましたが、いずれもあるある探検隊のネタは創作できませんでした。
なぜかはわかりませんが、GPTは文字数のカウントが苦手なようです。

まとめ

AnthropicのルーツはOpenAIであり、ChatGPTと同じようなチャット型のAI「Claude」を提供していますが、知名度や実力値の点でOpenAIに遅れをとっている印象です。
しかし、Googleからの後押しやAnthropic独自の方向性（おそらく、安全性や信頼性）を磨いていけばOpenAIと共にAIの未来を作っていくプレイヤーになることは間違い無いのではないでしょうか。

参考

・Anthropicコーポレートサイト ( https://www.anthropic.com/ )
・techcrunch（https://techcrunch.com/tag/anthropic/）
・Bridge （ https://venturebeat.com/ai/as-anthropic-seeks-billions-to-take-on-openai-industrial-capture-is-nigh-or-is-it/ ）
・crunchbase (https://news.crunchbase.com/ai-robotics/anthropic-raise-google/)
・ロイター( https://jp.reuters.com/article/google-ai-ft-idJPKBN2UD1T3 )
・Bridge (https://thebridge.jp/2023/03/gb-tech-trend-085-poe-that-can-use-both-chatgpt-and-claude-gb-universe)