Voorstel meesterproef
2012-2013
Prof. Christophe
Croux
Voor het vastleggen
of bespreken van een onderwerp: neem contact op met
christophe.croux@econ.kuleuven.ac.be
(lokaal 05.109).
Vele
bedrijfseconomische en andere problemen kunnen beter begrepen worden na een
statistische of econometrische analyse. Een meesterproef in de econometrie zal
meestal volgende aspecten bevatten: (1) de probleemstelling en situering in de
literatuur (2) beschrijving van de data (3) de gebruikte econometrische methode
(4) bespreking van de resultaten (5) conclusie. Studenten mogen steeds zelf
onderwerpen voorstellen die dit schema volgen.
Hieronder een lijst van onderwerpen die we zelf aanbieden. Deze onderwerpen
sluiten aan bij wetenschappelijk onderzoek dat momenteel lopende is in mijn
onderzoeksteam.
Een zeer
goede meesterproef kan aanleiding geven tot een publicatie in een
wetenschappelijk tijdschrift of een eerste hoofdstuk vormen van een eventueel
doctoraal proefschrift.
(1) High-dimensional covariance matrix estimation for financial applications
The estimation of the covariance matrix of the returns of
financial assets is very useful for many financial applications, such as
portfolio allocation, option pricing and risk management in general. In these
applications, the number of assets (e.g. stocks) is typically quite large and
sometimes the number of assets is even larger than the number of observations
(e.g. the stocks’ daily returns). When the number of assets is large the
dimension of the covariance matrix of the returns also becomes large. Estimating
high-dimensional covariance matrices is intrinsically challenging. The
traditional covariance matrix estimator, the sample covariance matrix, is known
to be unbiased, but it is invertible only when the dimensionality is no larger
than the sample size. This is a problem since the inverse of the covariance
matrix is often needed in financial applications. In the literature, new
covariance matrix estimators have been proposed to overcome this problem (and
other problems) of the classical covariance matrix estimator.
The purpose of this master thesis is to
review and compare the latest proposals in this context and apply these
covariance matrix estimators in a realistic portfolio allocation setting which
allows to compare their empirical performance. The dataset for this analysis
should consist of the daily returns of a large number of stocks.
With the R package quantmod one can easily download the daily returns of
all S&P100 or S&P500 constituents from Yahoo or Google finance.
(2) Hotelratings: wat meten ze en hoe informatief zijn ze
Er bestaan meerdere websites waar gebruikers een rating kunnen geven van hun verblijf in een hotel of ander vakantieoord. Vele consumenten gebruiken deze ratings om een erste idee te krijgen van hun vakantiebestemming. Er zijn nu meerdere vragen die zich stellen (i) zijn deze ratings gerelateerd aan de prijs; kunnen we dit verband kantificeren?; Is het mogelijk om hotels te vinden die onder- of overgeprijsd zijn. (ii) wat is de interne consistentie van deze ratings. Is er een tendens over de tijd van de ratings? Dus hebben de beoorelingen de nieging steeds slechter/beter te worden. Geven verschillende websites gelijkaardige ratings?
(3)
Statistische analyse van data kubussen
In heel
wat bedrijfseconomische toepassingen kunnen de gegevens in de vorm van een kubus
gerepresenteerd worden. Zo kan een element van de kubus overeenkomen met alle
aankopen die verricht voor een bepaald product (eerste dimensie) in een bepaalde
winkel (tweede dimensie) op een bepaald tijdstip (derde dimensie). We willen nu
de gegevens in deze kubus grafisch representeren, zodat we bijvoorbeeld op een
gemakkelijke manier kunnen zien welke producten waar en wanneer gekocht worden.
Zulke grafieken moeten eenvoudig interpreteerbaar zijn voor managers. De
constructie van deze grafieken kan met behulp van dimensiereductietechnieken.
Echter, deze data kubussen kunnen zeer groot zijn, met ook veel lege elementen
in, en er kunnen ook uitschieters aanwezig zijn. Daarom zullen we beroep moeten
doen op recent ontwikkelde statistische technieken.