1,721,022 research outputs found

    Combining strategies efficiently: high-quality decisions from conflicting advice

    Full text link
    Dagelijks baseren we talloze praktische beslissingen en handelingen op adviezen van experts. Helaas zijn de experts het lang niet altijd met elkaar eens. Wouter Koolen ontwierp nieuwe computerprogramma’s die automatisch leren welk advies het beste gevolgd kan worden. Deze computerprogramma’s weten ook precies hoe ze door de tijd moeten schakelen tussen de adviezen van de verschillende deskundigen. Dit onderzoek is onderdeel van online learning, een opkomende discipline op het grensvlak tussen informatica, informatietheorie en statistiek. Koolen beschrijft toepassingen variërend van investeren in aandelen, kansvoorspellen en datacompressie tot routeplanning. In elk van deze gevallen bewijst hij wiskundig dat zijn computerprogramma's net zo succesvol zijn als een hypothetische beslisser met complete voorkennis van de toekomst, minus lage leerkosten

    The Pareto Regret Frontier

    Full text link
    Performance guarantees for online learning algorithms typically take the form of regret bounds, which express that the cumulative loss overhead compared to the best expert in hindsight is small. In the common case of large but structured expert sets we typically wish to keep the regret especially small compared to simple experts, at the cost of modest additional overhead compared to more complex others. We study which such regret trade-offs can be achieved, and how.\ud \ud We analyse regret w.r.t. each individual expert as a multi-objective criterion in the simple but fundamental case of absolute loss. We characterise the achievable and Pareto optimal trade-offs, and the corresponding optimal strategies for each sample size both exactly for each finite horizon and asymptotically

    Combining strategies efficiently: high-quality decisions from conflicting advice

    Full text link
    Dagelijks baseren we talloze praktische beslissingen en handelingen op adviezen van experts. Helaas zijn de experts het lang niet altijd met elkaar eens. Wouter Koolen ontwierp nieuwe computerprogramma’s die automatisch leren welk advies het beste gevolgd kan worden. Deze computerprogramma’s weten ook precies hoe ze door de tijd moeten schakelen tussen de adviezen van de verschillende deskundigen. Dit onderzoek is onderdeel van online learning, een opkomende discipline op het grensvlak tussen informatica, informatietheorie en statistiek. Koolen beschrijft toepassingen variërend van investeren in aandelen, kansvoorspellen en datacompressie tot routeplanning. In elk van deze gevallen bewijst hij wiskundig dat zijn computerprogramma's net zo succesvol zijn als een hypothetische beslisser met complete voorkennis van de toekomst, minus lage leerkosten

    Universal codes from switching strategies

    No full text
    We discuss algorithms for combining sequential prediction strategies, a task which can be viewed as a natural generalisation of the concept of universal coding. We describe a graphical language based on Hidden Markov Models for defining prediction strategies, and we provide both existing and new models as examples. The models include efficient, parameterless models for switching between the input strategies over time, including a model for the case where switches tend to occur in clusters, and finally a new model for the scenario where the prediction strategies have a known relationship, and where jumps are typically between strongly related ones. This last model is relevant for coding time series data where parameter drift is expected. As theoretical contributions we introduce an interpolation construction that is useful in the development and analysis of new algorithms, and we establish a new sophisticated lemma for analysing the individual sequence regret of parameterised models
    corecore