Phonic, nền tảng AI Voice AI, đảm bảo đầu tư từ Lux

Trang chủ

Tin tức

Ngày 10 tháng 4 năm 2025

BrianWalker

189

# voice AI # mit

Phonic, nền tảng AI Voice AI, đảm bảo đầu tư từ Lux

Giọng nói do AI tạo ra đã trở nên khá ấn tượng, bạn biết không? Chúng đã đạt đến mức độ phù hợp cho các ứng dụng như sách nói, podcast, đọc bài viết to, và thậm chí là hỗ trợ khách hàng cơ bản. Tuy nhiên, nhiều doanh nghiệp vẫn chưa hoàn toàn tin tưởng vào độ tin cậy của công nghệ giọng nói AI cho hoạt động của họ.

Đó là lúc Moin Nadeem và Nikhil Murthy, hai cựu sinh viên MIT, xuất hiện. Họ đã thành lập Phonic, một công ty tập trung vào việc nâng cao độ tin cậy của giọng nói tổng hợp đồng thời giảm thiểu độ trễ. Hai người này đã là bạn bè hơn bảy năm, kể từ khi họ gặp nhau tại MIT. Khi khởi động Phonic vào năm ngoái, họ nhận thấy một khoảng trống trên thị trường—không ai thực sự cung cấp một giải pháp công nghệ giọng nói toàn diện.

"AI giọng nói đang ở giai đoạn mà bạn phải kết hợp các thành phần khác nhau, như nhận diện giọng nói tự động và chuyển văn bản thành giọng nói, rồi thêm một chút thông minh," Murthy giải thích với TechCrunch. "Nhưng khi chúng tôi trò chuyện với khách hàng thực tế, chúng tôi nhận ra thiếu các giải pháp có thể xử lý mọi thứ một cách đáng tin cậy trên quy mô lớn."

Nadeem, người từng làm việc tại MosaicML (được Databricks mua lại với giá 1,3 tỷ USD vào năm 2023), chỉ ra rằng nhiều công ty trong lĩnh vực AI giọng nói, như Vapi và Rounded, chỉ đang ghép nối các mô hình AI khác nhau. Phonic, ngược lại, làm mọi thứ khác biệt—họ huấn luyện mô hình của mình từ đầu đến cuối, hoàn toàn nội bộ. Murthy cho rằng cách tiếp cận này mang lại nhiều lợi ích lớn.

"Khi bạn sở hữu các mô hình, bạn thực sự có thể tích hợp các tính năng độ tin cậy vững chắc ngay vào chính các mô hình đó," anh nói. "Nếu bạn không kiểm soát lớp đó, bạn chỉ đang cố gắng ghép nối các mảnh không thực sự ăn khớp với nhau."

Ngoài ra, Murthy đề cập rằng cách làm của Phonic cho phép họ lưu trữ và vận hành các mô hình một cách tiết kiệm chi phí. Họ huấn luyện mô hình của mình trên nhiều loại bản ghi âm, bao gồm giọng nói có khẩu âm và bị bóp méo, để đảm bảo chúng cực kỳ mạnh mẽ.

Hiện tại, Phonic đang làm việc với một nhóm đối tác chọn lọc trong ngành bảo hiểm và chăm sóc sức khỏe, nhưng họ đang chuẩn bị cho một đợt ra mắt rộng rãi hơn trong vài tháng tới. Nadeem cho biết chẳng bao lâu nữa, bất kỳ ai quan tâm cũng có thể thử công nghệ của Phonic ngay từ trang web của họ.

Phonic đã huy động được 4 triệu USD trong vòng gọi vốn hạt giống, với Lux dẫn đầu vòng này và một số tên tuổi lớn như đồng sáng lập Replit Amjad Masad, đồng sáng lập Hugging Face Clem Delangue, đồng sáng lập Applied Intuition Qasar Younis, và nhà sáng lập Modal Labs Erik Bernhardsson tham gia góp vốn.

Grace Isford từ Lux Capital cho biết họ bị thu hút bởi cách tiếp cận độc đáo của Phonic trong việc huấn luyện mô hình nội bộ. "Chúng tôi nghĩ cả Moin và Nikhil đều là những nhà công nghệ xuất sắc," cô nói. "Họ đã thành lập một câu lạc bộ học máy tại MIT và đã làm việc với việc huấn luyện mô hình từ lâu. Phương pháp của họ trong việc kết hợp các mô hình khuếch tán và mô hình độc quyền trong lĩnh vực AI giọng nói khá là sáng tạo."

Bài viết liên quan

Wispr Flow Ra Mắt Ứng Dụng iOS để Cách Mạng Hóa Việc Ghi Âm Các công ty AI ngày càng khuyến khích người dùng tương tác bằng giọng nói với sản phẩm của họ. Những gã khổng lồ như Meta, Google, OpenAI và Anthropic đã nâng cấp các bot AI của họ với khả năng chuyển

Nghiên cứu MIT cho thấy AI không, trên thực tế, có các giá trị Một nghiên cứu đã lan truyền một vài tháng trước cho thấy rằng AI phát triển cao hơn, nó có thể phát triển "hệ thống giá trị" của riêng mình, có khả năng ưu tiên hạnh phúc của chính nó hơn con người. Tuy nhiên, một nghiên cứu gần đây của MIT thách thức ý tưởng này, kết luận rằng AI không thực sự sở hữu các giá trị mạch lạc.

Top 10 máy phát điện thoại AI cho tháng 4 năm 2025 được tiết lộ Thế giới công nghệ đã được chuyển đổi bởi trí tuệ nhân tạo, và một trong những lĩnh vực năng động nhất trong lĩnh vực này là tạo giọng nói AI. Những công cụ này đã trở nên cực kỳ tiên tiến, cung cấp nhiều tiếng nói có thể được tùy chỉnh để phù hợp với các nhu cầu và sở thích khác nhau. Từ cr

Nhận xét (48)

0/200

Nộp

DonaldRoberts

15:40:05 GMT+07:00 Ngày 04 tháng 8 năm 2025

AI voices are getting wild! Phonic’s tech sounds super promising for podcasts and support. Excited to see where this investment takes them! 🎙️

EdwardYoung

08:19:30 GMT+07:00 Ngày 28 tháng 7 năm 2025

Whoa, AI voices are getting so real! Phonic's tech sounds like it could make audiobooks way more immersive. Curious if they’ll tackle accents next—imagine a perfect British narrator for my favorite novels! 😄

RogerKing

08:25:03 GMT+07:00 Ngày 22 tháng 7 năm 2025

Whoa, AI voices are getting wild! Phonic sounds like it’s killing it with this tech. I wonder if it’ll make audiobooks feel like a real person’s reading to me. 🤔 Excited to see where this goes!

FrankSmith

22:26:22 GMT+07:00 Ngày 23 tháng 4 năm 2025

Las voces de IA de Phonic son bastante geniales, pero no estoy seguro de que estén listas para el soporte al cliente todavía. Suenan bien para audiolibros y cosas así, pero las empresas necesitan más fiabilidad. Aún así, ¡es genial que hayan obtenido financiación de Lux! 🚀

GregoryAdams

09:16:06 GMT+07:00 Ngày 20 tháng 4 năm 2025

Phonic의 AI 음성은 꽤 멋지지만, 고객 지원에서 사용하기에는 아직 준비가 덜 된 것 같아요. 오디오북 등에는 좋지만, 비즈니스에서는 더 많은 신뢰성이 필요해요. 그래도 Lux로부터 투자받은 건 정말 멋지네요! 🚀

WillieAdams

03:07:59 GMT+07:00 Ngày 18 tháng 4 năm 2025

Phonic's AI voices are pretty slick, but I'm not sure if they're ready for prime time in customer support yet. They sound good for audiobooks and stuff, but businesses need more reliability. Still, it's cool they got funding from Lux! 🚀

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek

Hơn

Đặc trưng