Skip to Main Content (Press Enter)

Logo UNIMI
  • ×
  • Home
  • Persone
  • Attività
  • Ambiti
  • Strutture
  • Pubblicazioni
  • Terza Missione

Expertise & Skills
Logo UNIMI

|

Expertise & Skills

unimi.it
  • ×
  • Home
  • Persone
  • Attività
  • Ambiti
  • Strutture
  • Pubblicazioni
  • Terza Missione
  1. Pubblicazioni

Improved Regret Bounds for Bandits with Expert Advice

Articolo
Data di Pubblicazione:
2025
Citazione:
Improved Regret Bounds for Bandits with Expert Advice / N. Cesa Bianchi, K. Eldowa, E. Esposito, J. Olkhovskaya. - In: JOURNAL OF ARTIFICIAL INTELLIGENCE RESEARCH. - ISSN 1943-5037. - 83:(2025 Jul), pp. 6.1-6.14. [10.1613/jair.1.16738]
Abstract:
In this research note, we revisit the bandits with expert advice problem. Under a restricted feedback model, we prove a lower bound of order (Formula presented) for the worst-case regret, where K is the number of actions, N > K the number of experts, and T the time horizon. This matches a previously known upper bound of the same order and improves upon the best available lower bound of (Formula presented). For the standard feedback model, we prove a new instance-based upper bound that depends on the agreement between the experts and provides a logarithmic improvement compared to prior results.
Tipologia IRIS:
01 - Articolo su periodico
Elenco autori:
N. Cesa Bianchi, K. Eldowa, E. Esposito, J. Olkhovskaya
Autori di Ateneo:
CESA BIANCHI NICOLO' ANTONIO ( autore )
ELDOWA KHALED MAZEN MAHMOUD ELSAYED ( autore )
ESPOSITO EMMANUEL ( autore )
Link alla scheda completa:
https://air.unimi.it/handle/2434/1176015
Link al Full Text:
https://air.unimi.it/retrieve/handle/2434/1176015/3112385/16738_final.pdf
Progetto:
Algorithms, Games, and Digital Markets (ALGADIMAR)
  • Aree Di Ricerca

Aree Di Ricerca

Settori


Settore INFO-01/A - Informatica
  • Informazioni
  • Assistenza
  • Accessibilità
  • Privacy
  • Utilizzo dei cookie
  • Note legali

Realizzato con VIVO | Progettato da Cineca | 25.11.5.0