De belangrijkste technologie van audiozoom is beamforming of ruimtelijke filtering. Hiermee kan de richting van de audio-opname worden aangepast (dat wil zeggen, de richting van de geluidsbron wordt gedetecteerd) en naar behoefte worden bijgesteld. In dit geval is de optimale richting een supercardioïde patroon (zie afbeelding hieronder), dat geluid dat van voren komt (dat wil zeggen, rechtstreeks vanuit de camera) versterkt, terwijl geluid uit andere richtingen (achtergrondgeluid) wordt gedempt.
De basis van deze technologie is dat het noodzakelijk is om zoveel mogelijk omnidirectionele microfoons te gebruiken: hoe meer microfoons en hoe verder ze van elkaar verwijderd zijn, hoe meer geluid er kan worden opgenomen. Wanneer een telefoon is uitgerust met twee microfoons, worden deze meestal aan de boven- en onderkant geplaatst om de afstand tussen elkaar te maximaliseren; de signalen die door de microfoons worden opgevangen, zullen dan in de beste combinatie een supercardioïde richtingsgevoeligheid vormen.
De afbeelding links is een typische audio-opname; de audiozoom op de afbeelding rechts heeft een supercardioïde richtingsgevoeligheid, waardoor de opname gevoeliger is voor de geluidsbron en achtergrondgeluid wordt verminderd.
Het resultaat van deze hoge directionaliteit wordt verkregen door een niet-directionele ontvanger te gebruiken, waarbij verschillende versterkingen worden ingesteld voor elke groep individuele microfoons op verschillende locaties in de telefoon. Vervolgens worden de fasen van de pieken opgeteld om het gewenste geluid te versterken en de zijgolven te onderdrukken om interferentie buiten de as te verminderen.
Tenminste, in theorie. In werkelijkheid kent beamforming in smartphones echter ook zijn eigen problemen. Enerzijds kunnen mobiele telefoons geen gebruik maken van de condensatormicrofoontechnologie die in grote opnamestudio's te vinden is, maar moeten ze elektrettransducers gebruiken – miniatuur MEMS-microfoons (micro-elektromechanische systemen) die zeer weinig stroom verbruiken. Bovendien moeten smartphonefabrikanten, om de verstaanbaarheid te optimaliseren en de karakteristieke spectrale en temporele artefacten die optreden bij ruimtelijke filtering (zoals vervorming, basverlies en een algeheel geluid met ernstige fase-interferentie/nasaliteit) te beheersen, niet alleen zorgvuldig rekening houden met de plaatsing van de microfoon, maar ook vertrouwen op hun eigen unieke combinatie van geluidsfuncties, zoals equalizers, spraakherkenning en noise gates (die zelf ook hoorbare artefacten kunnen veroorzaken).
Logischerwijs heeft elke fabrikant zijn eigen unieke beamforming-methode in combinatie met gepatenteerde technologie. Elk van de verschillende beamforming-technieken heeft zo zijn sterke punten, van het verwijderen van nagalm bij spraak tot ruisonderdrukking. Beamforming-algoritmes kunnen echter gemakkelijk windgeruis in de opgenomen audio versterken, en niet iedereen kan of wil een extra windscherm gebruiken om de MEMS te beschermen. En waarom verwerken de microfoons in smartphones niet meer? Omdat dat ten koste gaat van de frequentierespons en gevoeligheid van de microfoon. Fabrikanten vertrouwen daarom vaak op software om ruis en windgeruis te verminderen.
Daarnaast is het onmogelijk om het werkelijke windgeruis in een natuurlijke akoestische omgeving onder laboratoriumomstandigheden te simuleren, en tot nu toe bestaat er nog geen goede technische oplossing om dit probleem aan te pakken. Fabrikanten moeten daarom unieke digitale windbeschermingstechnologieën ontwikkelen (die toepasbaar zijn ongeacht de beperkingen van het industriële ontwerp van het product) op basis van de analyse van opgenomen audio. Nokia's OZO Audio Zoom neemt geluid op met behulp van zijn windbestendige technologie.
Net als ruisonderdrukking en vele andere populaire technieken, werd beamforming oorspronkelijk ontwikkeld voor militaire doeleinden. Gefaseerde zenderarrays werden tijdens de Tweede Wereldoorlog gebruikt als radarantennes en worden tegenwoordig gebruikt voor uiteenlopende toepassingen, van medische beeldvorming tot muzikale evenementen. Gefaseerde microfoonarrays werden in de jaren 70 uitgevonden door John Billingsley (nee, niet de acteur die Dr. Volash speelde in Star Trek: Enterprise) en Roger Kinns. Hoewel de prestaties van deze technologie in smartphones de afgelopen tien jaar niet significant zijn verbeterd, zijn sommige toestellen groter, hebben sommige meerdere microfoons en sommige zelfs krachtigere chipsets. De mobiele telefoon zelf heeft een hoger niveau, waardoor de audiozoomtechnologie effectiever is in diverse audio-toepassingen.
In het artikel van N. van Wijngaarden en EH Wouters, "Enhancing Sound by Beamforming Using Smartphones", staat: "Het komt in je op dat surveillance-staten (of -bedrijven) specifieke beamforming-technieken kunnen gebruiken om alle inwoners te bespioneren. Maar in hoeverre kan een beamforming-systeem van een smartphone bijdragen aan massasurveillance? [...] Theoretisch gezien zou het, als de technologie verder ontwikkeld wordt, een wapen in het arsenaal van de surveillance-staat kunnen worden, maar dat is nog ver weg. De specifieke beamforming-technologie op smartphones is nog relatief onbekend terrein, en het ontbreken van een mute-functie en de onopvallende synchronisatiemogelijkheden beperken de kans op heimelijk afluisteren."
Geplaatst op: 14 juni 2022
