livekit · chenghao-mou · Feb 5, 2026 · Mar 6, 2026 · Mar 11, 2026 · Mar 11, 2026
diff --git a/README.md b/README.md
@@ -47,7 +47,7 @@ agents that can see, hear, and understand.
 To install the core Agents library, along with plugins for popular model providers:
 
 ```bash
-pip install "livekit-agents[openai,silero,deepgram,cartesia,turn-detector]"
+pip install "livekit-agents[openai,silero,deepgram,cartesia]"
 ```
 
 ## Docs and guides

diff --git a/examples/README.md b/examples/README.md
@@ -54,7 +54,7 @@ To run the examples, you'll need:
 
 - A [LiveKit Cloud](https://cloud.livekit.io) account or a local [LiveKit server](https://github.com/livekit/livekit)
 - API keys for the model providers you want to use in a `.env` file
-- Python 3.9 or higher
+- Python 3.10 or higher
 - [uv](https://docs.astral.sh/uv/)
 
 ### Environment file

diff --git a/examples/avatar_agents/audio_wave/agent_worker.py b/examples/avatar_agents/audio_wave/agent_worker.py
@@ -18,7 +18,6 @@
 from livekit.agents.voice.avatar import DataStreamAudioOutput
 from livekit.agents.voice.io import PlaybackFinishedEvent, PlaybackStartedEvent
 from livekit.agents.voice.room_io import ATTRIBUTE_PUBLISH_ON_BEHALF
-from livekit.plugins import silero
 
 load_dotenv()
 
@@ -75,7 +74,6 @@ async def entrypoint(ctx: JobContext):
         stt=inference.STT("deepgram/nova-3"),
         llm=inference.LLM("google/gemini-2.5-flash"),
         tts=inference.TTS("cartesia/sonic-3"),
-        vad=silero.VAD.load(),
         resume_false_interruption=False,
     )
 

diff --git a/examples/avatar_agents/keyframe/agent_worker.py b/examples/avatar_agents/keyframe/agent_worker.py
@@ -14,9 +14,9 @@
     function_tool,
     inference,
 )
-from livekit.plugins import keyframe, silero
+from livekit.agents.inference import AudioTurnDetector
+from livekit.plugins import keyframe
 from livekit.plugins.keyframe import Emotion
-from livekit.plugins.turn_detector.multilingual import MultilingualModel
 
 load_dotenv()
 
@@ -51,8 +51,7 @@ async def entrypoint(ctx: JobContext):
         llm=inference.LLM("google/gemini-2.5-flash"),
         tts=inference.TTS("cartesia/sonic-3"),
         resume_false_interruption=False,
-        vad=silero.VAD.load(),
-        turn_detection=MultilingualModel(),
+        turn_detection=AudioTurnDetector(),
     )
 
     avatar = keyframe.AvatarSession(persona_slug="public:cosmo_persona-1.5-live")

diff --git a/examples/drive-thru/agent.py b/examples/drive-thru/agent.py
@@ -34,8 +34,7 @@
     function_tool,
     inference,
 )
-from livekit.plugins import silero
-from livekit.plugins.turn_detector.multilingual import MultilingualModel
+from livekit.agents.inference import AudioTurnDetector
 
 load_dotenv()
 
@@ -487,8 +486,7 @@ async def drive_thru_agent(ctx: JobContext) -> None:
         ),
         llm=inference.LLM("openai/gpt-5-mini"),
         tts=inference.TTS("cartesia/sonic-3", voice="f786b574-daa5-4673-aa0c-cbe3e8534c02"),
-        turn_detection=MultilingualModel(),
-        vad=silero.VAD.load(),
+        turn_detection=AudioTurnDetector(),
         max_tool_steps=10,
     )
 

diff --git a/examples/frontdesk/agent.py b/examples/frontdesk/agent.py
@@ -38,8 +38,7 @@
     task_completion_judge,
     tool_use_judge,
 )
-from livekit.plugins import silero
-from livekit.plugins.turn_detector.multilingual import MultilingualModel
+from livekit.agents.inference import AudioTurnDetector
 
 load_dotenv()
 
@@ -266,8 +265,7 @@ async def frontdesk_agent(ctx: JobContext):
         stt=inference.STT("deepgram/nova-3"),
         llm=inference.LLM("google/gemini-2.5-flash"),
         tts=inference.TTS("cartesia/sonic-3", voice="39b376fc-488e-4d0c-8b37-e00b72059fdd"),
-        turn_detection=MultilingualModel(),
-        vad=silero.VAD.load(),
+        turn_detection=AudioTurnDetector(),
         max_tool_steps=1,
     )
 

diff --git a/examples/healthcare/agent.py b/examples/healthcare/agent.py
@@ -32,7 +32,6 @@
     WarmTransferTask,
 )
 from livekit.agents.llm import ToolError, function_tool
-from livekit.plugins import silero
 
 logger = logging.getLogger("HealthcareAgent")
 
@@ -754,7 +753,6 @@ async def entrypoint(ctx: JobContext):
         stt=inference.STT("deepgram/nova-3", language="multi"),
         llm=inference.LLM("openai/gpt-4.1-mini"),
         tts=inference.TTS("inworld/inworld-tts-1"),
-        vad=silero.VAD.load(),
         preemptive_generation=True,
     )
 

diff --git a/examples/inference/agent.py b/examples/inference/agent.py
@@ -12,7 +12,6 @@
     cli,
     inference,
 )
-from livekit.plugins import silero
 from livekit.rtc import RpcInvocationData
 
 logger = logging.getLogger("inference")
@@ -59,7 +58,6 @@ async def entrypoint(ctx: JobContext) -> None:
         stt=inference.STT(model=DEFAULT_STT),
         llm=inference.LLM(model=DEFAULT_LLM),
         tts=inference.TTS(model=DEFAULT_TTS),
-        vad=silero.VAD.load(),
     )
 
     def parse_value(payload: str, fallback: str) -> str:

diff --git a/examples/other/elevenlab_scribe_v2.py b/examples/other/elevenlab_scribe_v2.py
@@ -2,8 +2,8 @@
 
 from dotenv import load_dotenv
 
-from livekit.agents import Agent, AgentServer, AgentSession, JobContext, JobProcess, cli, inference
-from livekit.plugins import elevenlabs, silero
+from livekit.agents import Agent, AgentServer, AgentSession, JobContext, cli, inference
+from livekit.plugins import elevenlabs
 
 logger = logging.getLogger("realtime-scribe-v2")
 logger.setLevel(logging.INFO)
@@ -14,13 +14,6 @@
 server = AgentServer()
 
 
-def prewarm(proc: JobProcess) -> None:
-    proc.userdata["vad"] = silero.VAD.load()
-
-
-server.setup_fnc = prewarm
-
-
 @server.rtc_session()
 async def entrypoint(ctx: JobContext) -> None:
     # Using ElevenLabs STT plugin directly for realtime mode support
@@ -37,7 +30,6 @@ async def entrypoint(ctx: JobContext) -> None:
 
     session: AgentSession = AgentSession(
         allow_interruptions=True,
-        vad=ctx.proc.userdata["vad"],
         stt=stt,
         llm=inference.LLM("openai/gpt-4.1-mini"),
         tts=inference.TTS("cartesia/sonic-3"),

diff --git a/examples/other/kokoro_tts.py b/examples/other/kokoro_tts.py
@@ -2,9 +2,16 @@
 
 from dotenv import load_dotenv
 
-from livekit.agents import Agent, AgentServer, AgentSession, JobContext, JobProcess, cli, metrics
+from livekit.agents import (
+    Agent,
+    AgentServer,
+    AgentSession,
+    JobContext,
+    cli,
+    metrics,
+)
 from livekit.agents.voice import MetricsCollectedEvent
-from livekit.plugins import deepgram, openai, silero
+from livekit.plugins import deepgram, openai
 
 logger = logging.getLogger("kokoro-tts-agent")
 
@@ -27,13 +34,6 @@ def __init__(self) -> None:
 server = AgentServer()
 
 
-def prewarm(proc: JobProcess):
-    proc.userdata["vad"] = silero.VAD.load()
-
-
-server.setup_fnc = prewarm
-
-
 @server.rtc_session()
 async def entrypoint(ctx: JobContext):
     # each log entry will include these fields
@@ -42,7 +42,6 @@ async def entrypoint(ctx: JobContext):
         "user_id": "your user_id",
     }
     session = AgentSession(
-        vad=ctx.proc.userdata["vad"],
         # any combination of STT, LLM, TTS, or realtime API can be used
         llm=openai.LLM(model="gpt-4.1-mini"),
         stt=deepgram.STT(model="nova-3", language="multi"),

diff --git a/examples/other/transcription/multi-user-transcriber.py b/examples/other/transcription/multi-user-transcriber.py
@@ -10,15 +10,13 @@
     AgentSession,
     AutoSubscribe,
     JobContext,
-    JobProcess,
     StopResponse,
     cli,
     inference,
     llm,
     room_io,
     utils,
 )
-from livekit.plugins import silero
 
 load_dotenv()
 
@@ -91,9 +89,7 @@ async def _start_session(self, participant: rtc.RemoteParticipant) -> AgentSessi
         if participant.identity in self._sessions:
             return self._sessions[participant.identity]
 
-        session = AgentSession(
-            vad=self.ctx.proc.userdata["vad"],
-        )
+        session = AgentSession()
         await session.start(
             agent=Transcriber(
                 participant_identity=participant.identity,
@@ -136,11 +132,5 @@ async def cleanup():
     ctx.add_shutdown_callback(cleanup)
 
 
-def prewarm(proc: JobProcess):
-    proc.userdata["vad"] = silero.VAD.load()
-
-
-server.setup_fnc = prewarm
-
 if __name__ == "__main__":
     cli.run_app(server)
diff --git a/examples/other/transcription/transcriber.py b/examples/other/transcription/transcriber.py
@@ -11,11 +11,12 @@
     MetricsCollectedEvent,
     StopResponse,
     cli,
+    inference,
     llm,
     metrics,
     room_io,
 )
-from livekit.plugins import openai, silero
+from livekit.plugins import openai
 
 load_dotenv()
 
@@ -50,7 +51,7 @@ async def entrypoint(ctx: JobContext):
 
     session = AgentSession(
         # vad is needed for non-streaming STT implementations
-        vad=silero.VAD.load(min_silence_duration=0.3),
+        vad=inference.VAD(model="silero", min_silence_duration=0.3),
     )
 
     @session.on("metrics_collected")

diff --git a/examples/other/transcription/translator.py b/examples/other/transcription/translator.py
@@ -17,7 +17,7 @@
     room_io,
     utils,
 )
-from livekit.plugins import openai, silero
+from livekit.plugins import openai
 
 load_dotenv()
 
@@ -76,7 +76,6 @@ async def entrypoint(ctx: JobContext):
 
     session = AgentSession(
         # vad is only needed for non-streaming STT implementations
-        vad=silero.VAD.load(),
     )
 
     @session.on("metrics_collected")

diff --git a/examples/primitives/echo-agent.py b/examples/primitives/echo-agent.py
@@ -9,9 +9,9 @@
     AutoSubscribe,
     JobContext,
     cli,
+    inference,
 )
 from livekit.agents.vad import VADEventType
-from livekit.plugins import silero
 
 load_dotenv()
 logger = logging.getLogger("echo-agent")
@@ -35,7 +35,8 @@ async def entrypoint(ctx: JobContext):
         participant=participant,
         track_source=rtc.TrackSource.SOURCE_MICROPHONE,
     )
-    vad = silero.VAD.load(
+    vad = inference.VAD(
+        model="silero",
         min_speech_duration=0.2,
         min_silence_duration=0.6,
     )

diff --git a/examples/survey/agent.py b/examples/survey/agent.py
@@ -20,9 +20,8 @@
     room_io,
 )
 from livekit.agents.beta.workflows import GetEmailTask, TaskGroup
+from livekit.agents.inference import AudioTurnDetector
 from livekit.agents.llm import function_tool
-from livekit.plugins import silero
-from livekit.plugins.turn_detector.multilingual import MultilingualModel
 
 logger = logging.getLogger("SurveyAgent")
 
@@ -354,8 +353,7 @@ async def entrypoint(ctx: JobContext):
         llm=inference.LLM("google/gemini-2.5-flash"),
         stt=inference.STT("deepgram/nova-3", language="multi"),
         tts=inference.TTS("inworld/inworld-tts-1"),
-        vad=silero.VAD.load(),
-        turn_detection=MultilingualModel(),
+        turn_detection=AudioTurnDetector(),
         preemptive_generation=True,
     )
 

diff --git a/examples/telephony/amd.py b/examples/telephony/amd.py
@@ -11,12 +11,10 @@
     AgentServer,
     AgentSession,
     JobContext,
-    JobProcess,
     cli,
     inference,
 )
-from livekit.plugins import silero
-from livekit.plugins.turn_detector.multilingual import MultilingualModel
+from livekit.agents.inference import AudioTurnDetector
 
 logger = logging.getLogger("basic-agent")
 
@@ -38,13 +36,6 @@ def __init__(self) -> None:
 server = AgentServer()
 
 
-def prewarm(proc: JobProcess):
-    proc.userdata["vad"] = silero.VAD.load()
-
-
-server.setup_fnc = prewarm
-
-
 @server.rtc_session()
 async def entrypoint(ctx: JobContext):
     ctx.log_context_fields = {
@@ -54,8 +45,7 @@ async def entrypoint(ctx: JobContext):
         stt=inference.STT("deepgram/nova-3", language="multi"),
         llm=inference.LLM("openai/gpt-4.1-mini"),
         tts=inference.TTS("cartesia/sonic-3", voice="9626c31c-bec5-4cca-baa8-f8ba9e84c8bc"),
-        turn_detection=MultilingualModel(),
-        vad=ctx.proc.userdata["vad"],
+        turn_detection=AudioTurnDetector(),
         preemptive_generation=True,
     )
 

diff --git a/examples/telephony/bank-ivr/ivr_navigator_agent.py b/examples/telephony/bank-ivr/ivr_navigator_agent.py
@@ -9,15 +9,13 @@
     AgentServer,
     AgentSession,
     JobContext,
-    JobProcess,
     MetricsCollectedEvent,
     RunContext,
     cli,
     inference,
     metrics,
 )
 from livekit.agents.llm.tool_context import function_tool
-from livekit.plugins import silero
 
 logger = logging.getLogger("phone-tree-agent")
 
@@ -76,13 +74,6 @@ async def record_task_result_and_hang_up(self, context: RunContext, content: str
         context.session.shutdown(drain=True)
 
 
-def prewarm(proc: JobProcess) -> None:
-    proc.userdata["vad"] = silero.VAD.load()
-
-
-server.setup_fnc = prewarm
-
-
 @server.rtc_session(agent_name=PHONE_TREE_AGENT_DISPATCH_NAME)
 async def dtmf_session(ctx: JobContext) -> None:
     await ctx.connect()
@@ -91,7 +82,6 @@ async def dtmf_session(ctx: JobContext) -> None:
     }
 
     session: AgentSession = AgentSession(
-        vad=ctx.proc.userdata["vad"],
         llm=inference.LLM("openai/gpt-4.1"),
         stt=inference.STT("deepgram/nova-3"),
         tts=inference.TTS("rime/arcana"),