Problem C
Liszten Closely
Languages
en
sv
Vargen har satt sig själv i en knepig sits, han har ätit upp
farmor och måste nu låtsas vara farmor för rödluvan. Men
rödluvan har efter hon kom upp börjat ställa jobbiga frågor
till vad hon tror är farmor men som i verkligheten är
vargen.
Efter att rödluvan förolämpat vargen för sina stora öron
började hon testa vargens musikkunskap. Farmor älskar nämligen
klassisk musik och har dessutom perfekt gehör. Vargen kan inte
alls någon musik men han har ett par programmerbara
hörapparater han snodde från farmor. Han lyckas med hjälp av
ett telefonsamtal och morsekod kontakta dig som måste göra en
modell som kan ersätta farmors musikkunskaper genom
hörapparaterna.
Han har alltså bett dig att givet 19 noter och vilken
kompositör som skrev den, skriva ut vilken ton nästa not har
(på engelska "pitch").
Indata
Ladda ner zip-filen med träningsdata och testdata. Denna hittas längst ned vid "attachments". Datan kommer att innehålla ett intervall av 19 noter i ett stycke musik. Varje not beskrivs av sin starttid (i kolumnen "start"), sin längd (i kolumnen "duration"), sin ton (i kolumnen "pitch") och sin styrka (i kolumnen "velocity"). Dessutom innehåller datan vilken kompositör som skrev stycket. I träningsdatan finns dessutom svaret för varje fall, alltså vad för ton nästa not har.
Utdata
För varje testfall ska ditt program producera en rad med ett
flyttal: vad för ton nästa not har.
Poängsättning
Om $S$ är summan av alla differenser mellan din ton och den riktiga i kvadrat. Med andra ord, $S = (X_1 - Y_1)^2 + (X_2 - Y_2)^2 + ...$ där X och Y är de toner du tror är härnäst och de faktiska riktiga svaren respektive.
\[ \text{Poäng} = \max (0, \min (100, 200-x)) \]Vid slutet av tävlingen testas alla lösningar om på resterande 70% av siffrorna. Din poäng i slutet av tävlingen är alltså endast poängen på de resterande 70% av siffrorna, de 30% som du testats på hittills har ingen påverkan. Det är garanterat att de 30% som testas under tävlingen har valts uniformt slumpmässigt och är helt disjunkta från de 70% som du testas på i slutet. Därmed borde resultaten på de 30% som du testas på under tävlingen ses som en stark indikator på hur bra din lösning är. Samtidigt är det dåligt överanpassa (overfitta) din lösning till testdatan.