https://bodybydarwin.com
Slider Image

Programvara identifierar de mest spännande delarna av din hemvideo, redigerar de tråkiga ögonblicken

2020

Vem behöver ändå se två hela minuter av ditt barn som leker med en iPad? Datavetenskaplig doktorand Bin Zhao hävdar att han aldrig ens tittar på sina egna inspelningar. "Jag har många videor på min telefon, men verkligheten är att jag nästan aldrig tittar tillbaka på de videor som han berättar för Popular Science ." Huvudorsaken är att själva videon kan vara fem eller tio minuter lång. "

Zhao och hans rådgivare, Eric P. Xing från Carnegie Mellon University, har kommit med en intressant lösning på detta problem. De har skapat en algoritm som känner igen de tråkiga delarna av videor och redigerar dem. Slutprodukten är som en liten höjdspole. Användare kan till och med ange längden på rullen de vill ha - säg 30 sekunder. Mycket mer smältbart. "Vår motivation är att människor inte vill titta på den ursprungliga videon som Zhao säger.

Zhao och Xing är inte de första datavetarna som försöker automatiskt känna igen de intressanta eller viktiga delarna i en video. Många forskare och företag arbetar för att skapa programvara som upptäcker ovanlig aktivitet i övervakningsvideor medan det händer. Minst ett företag säger att det säljer ett system som kan göra det, men forskning pågår. Ett viktigt scenidentifierande program kan också vara en välsignelse för företag i sociala medier: Föreställ dig att du kan skapa kondenserade, snappy videor som du kan dela med dina internetvänner.

Den nya algoritmen fungerar genom att skapa en "ordbok" för att förklara vad den ser när den bearbetar en video. Sedan frågar sig varje gång sig själv. Kan jag förklara vad som händer nu med min ordlista? "Om svaret är nej, det är en indikation på att något nytt och spännande händer i videon, så algoritmen noterar det. Algoritmen gör inte Jag behöver inte se hela videon innan den börjar sätta ihop sin höjdspole. Detta, tillsammans med kodningstekniker som Zhao och Xing använde, hjälper algoritmen att arbeta snabbare.

Zhao säger att hans nya algoritm är ovanligt snabb och mänsklig i vilka scener den beslutar att utdraga. Den bearbetar en timmes video på en till två timmar, jämfört med de 10 till 20 timmars liknande algoritmer som publicerats i den vetenskapliga litteraturen kräver. För att testa om algoritmen väljer "intressanta" scener som en person skulle göra, bad Zhao och Xing tre personer att titta på videor och välja segment att markera från filmerna. Datorforskarna kontrollerade sedan hur nära de mänskliga och algoritmiska valen matchade. För 18 av 20 personliga videor gjorde Zhao och Xings algoritm mer mänskliga-liknande val än de tre andra konkurrerande algoritmerna som de testade. Paret kontrollerade också fem videor av säkerhetstyp som visar situationer som personer som kommer in i en tunnelbanestation. De hittade sin algoritm, plus en annan, bättre än resten. Zhao presenterar sina resultat den här veckan på en konferens som hålls av Institute of Electrical and Electronics Engineers.

Zhao planerar nu att starta en startup, PanOptus, för att kommersialisera sin programvara. En PanOptus iPhone-app och API finns i verken.

Kolla in algoritmen på jobbet på en video av Xings son:

"promo_image": {// s1.dmcdn.net/TqCJd/x240-OWi.jpg rubriker ": {With A Fountain, Full Video distributör": promo_image ": {// s2.dmcdn.net/TqCAE/x240-5SG .jpg rubriker ": {With A Fountain, Highlights distributör": {}
Kommer du ihåg att tiden Yosemites brandfall var faktiskt eld?

Kommer du ihåg att tiden Yosemites brandfall var faktiskt eld?

Stellar teleskop för dina rymdälskande barn

Stellar teleskop för dina rymdälskande barn

Dessa är Kinas planer för flytande kärnreaktorer

Dessa är Kinas planer för flytande kärnreaktorer