1 Zakład Bioinformatyki, Instytut Informatyki, Uniwersytet w Białymstoku
✉ Correspondence: Jarosław Kotowicz <j.kotowicz@uwb.edu.pl>
Rozkłady w R (rysowanie dystrybuant i gęstości rozkładów, dystrybuanty empirycznych - praca z ggplot2)
Wykonaj następujące polecenia:
- Ze strony Download Fuel Economy Data zapisz plik ze zbioru Datasets for All Model Years (1984–2020) (plik csv skompresowany) nazwa: Zipped CSV File.
- W R go rozpakuj.
- Podczytaj dokumentację do tego pliku (w tym samym wierszu co zbiór danych nazwa: Documentation)
- Wybieramy zmienne
- cityE (city electricity consumption in kw-hrs/100 miles),
- cityUF (EPA city utility factor (share of electricity) for PHEV),
- evMotor (electric motor (kw-hrs)),
- highwayE (highway electricity consumption in kw-hrs/100 miles).
- Wydziel ze zbioru danych podzbiór aut używających paliwa typu: electricity (operacją filtrowania po niezerowych obserwacjach dotyczących np. evMotor).
- Wykonaj na podzbioze podsumowania dotyczące każdej ze zmiennych liczbowych (średnia, warianacja, odchylenie standardowe min, max itp).
- Dla każdej zmiennej liczbowej wykonuj w ggplot2 rysunki:
- dysytrybuanty empirycznej warstawa stat_ecdf,
- wykresu pudełko-wąsy, histogramu, gęstości.
- Ustal ziarno generatora liczb pseudolosowych poleceniem set.seed(19032020)
- Korzystając z generatoróW liczb pseudolosowych rozkładów normalnego i beta (rnorm i rbeta), dla dwóch par różnych parametróW dla każdego z nich, wygeneruj po 200 liczb psuedolosowych. Masz mieć 4 ciągi liczb.
- Narysuj dla nich histogramy i dystrybuantę emiryczną.
- Prześli skryp R do dnia 25 marca br.
W razie pytań porszę o kontak e-mailowy.
Praca domowa z dnia 19 marca 2020r. (do laboratorium)
- Proszę wygenerować przy pomocy co najmniej 8 różnych generatorów liczb pseudolosowych (różne rozkłady prawdopodobieństwa) ciągi 200 liczb pseudolosowych. Proszę ustawić ziarno generatora liczbą psudolosowych na 19032020.
- Dla wylosowanych ciągów proszę narysować histogramy i dystrybuanty empiryczne.
- Proszę narysować wykresy gęstości i dystrybuant co najmniej 6 rozkładów prawdopodobieństwa przedstawianych na wykładzie (dla każdego z 5 wariantami parametrów). Gęstości (odpowiednio dystrybuanty) dla danego typu rozkładu mają być umieszczone na jednym rysunku.
- Proszę narysować podstawowe statystyki graficzne dla wybranych dwóch zmiennych czynnikowych i dwóch ciągłych (dyskretnych z dużą ilością obserwacji) z jednego ze zbioru acs_ny.csv lub acsNew.csv. Dane są dostępne na stronie Jareda P. Landera (w skrypcie zbiór należy pobrać, odpowiednio zmodyfikować dane i dopiero wtedy można rysować).
Termin przesłania 2 kwietnia br.
- Proszę się zapoznać na następne laboratoria ze sposobami liczenia przedziałów ufności Bibliotek rcompanion, 9. Calculating Confidence Intervals i How to Calculate Confidence Interval in R?.
Uwaga.
Nazwa pliku i tytuł e-maila ze skryptem z laboratorium i z pracą domową powinieny być zgodny ze następującym schematem NumerAlbumu_Nazwisko_PDxx lub NumerAlbumu_Nazwisko_Labxx, gdzie xx onacza numer pracy domowej lub zajęć laboratorium. Pracę domową i skrypt z laboratorium wysyłają Państwo oddzielnie!
.
LS0tDQp0aXRsZTogIk1ldG9keSBwcm9iYWJpbGlzdHljem5lIGkgc3RhdHlzdHlrYSAoaW5mb3JtYXR5a2EpIC0gbGFib3JhdG9yaXVtICINCmF1dGhvcjoNCi0gSmFyb3PFgmF3IEtvdG93aWN6Og0KICAgIGNvcnJlc3BvbmRlbmNlOiBubw0KICAgIGVtYWlsOiBqLmtvdG93aWN6QHV3Yi5lZHUucGwNCiAgICBpbnN0aXR1dGU6IElJVXdCDQpkYXRlOiAiMTkgbWFyY2EgMjAyMCINCm91dHB1dDoNCiAgaHRtbF9ub3RlYm9vazoNCiAgICBmaWdfY2FwdGlvbjogeWVzDQogICAgaGlnaGxpZ2h0OiBoYWRkb2NrDQogICAgbnVtYmVyX3NlY3Rpb25zOiB5ZXMNCiAgICBwYW5kb2NfYXJnczoNCiAgICAtIC0tbHVhLWZpbHRlcj1zY2hvbGFybHktbWV0YWRhdGEubHVhDQogICAgLSAtLWx1YS1maWx0ZXI9YXV0aG9yLWluZm8tYmxvY2tzLmx1YQ0KICAgIHRoZW1lOiBjZXJ1bGVhbg0KICAgIHRvYzogeWVzDQppbnN0aXR1dGU6DQotIElJVXdCOiBaYWvFgmFkIEJpb2luZm9ybWF0eWtpLCBJbnN0eXR1dCBJbmZvcm1hdHlraSwgVW5pd2Vyc3l0ZXQgdyBCaWHFgnltc3Rva3UNCmNzbDogYmlnLWRhdGEtYW5kLWluZm9ybWF0aW9uLWFuYWx5dGljcy5jc2wNCmFsd2F5c19hbGxvd19odG1sOiB5ZXMNCi0tLQ0KDQpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0NCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gVFJVRSkNCmBgYA0KDQojIEtzacSFxbxraSBpIGlubmUgcnplY3p5DQoNCjEuIFtSIGZvciBEYXRhIFNjaWVuY2VdKGh0dHBzOi8vcjRkcy5oYWQuY28ubnovaW5kZXguaHRtbCkNCjIuIFtnZ3Bsb3QyOiBFbGVnYW50IEdyYXBoaWNzIGZvciBEYXRhIEFuYWx5c2lzXShodHRwczovL2dncGxvdDItYm9vay5vcmcvKQ0KMy4gW0NvbG9ycyBpbiBSXShodHRwOi8vd3d3LnN0YXQuY29sdW1iaWEuZWR1L350emhlbmcvZmlsZXMvUmNvbG9yLnBkZikNCjQuIFvFmmNpxIVnaSBuYSBzdHJvbmllIHd3dy5ycHVicy5jb21dKGh0dHBzOi8vd3d3LnJwdWJzLmNvbS8pDQo1LiBaYmlvcnkgZGFueWNoIG5hIHN0cm9uaWUgW0phcmVkYSBQLiBMYW5kZXJdKGh0dHA6Ly93d3cuamFyZWRsYW5kZXIuY29tL2RhdGEvKSBpDQpbZnVlbGVjb25vbXkuZ292XShodHRwczovL2Z1ZWxlY29ub215Lmdvdi9mZWcvZG93bmxvYWQuc2h0bWwpDQoNCiMgUm96a8WCYWR5IHcgUiAocnlzb3dhbmllIGR5c3RyeWJ1YW50IGkgZ8SZc3RvxZtjaSByb3prxYJhZMOzdywgZHlzdHJ5YnVhbnR5IGVtcGlyeWN6bnljaCAtIHByYWNhIHogZ2dwbG90MikNCg0KV3lrb25haiBuYXN0xJlwdWrEhWNlIHBvbGVjZW5pYToNCg0KMS4gWmUgc3Ryb255IFtEb3dubG9hZCBGdWVsIEVjb25vbXkgRGF0YV0oaHR0cHM6Ly9mdWVsZWNvbm9teS5nb3YvZmVnL2Rvd25sb2FkLnNodG1sKSB6YXBpc3ogcGxpaw0KemUgemJpb3J1IERhdGFzZXRzIGZvciBBbGwgTW9kZWwgWWVhcnMgKDE5ODTigJMyMDIwKSAocGxpayBjc3Ygc2tvbXByZXNvd2FueSkgbmF6d2E6ICoqWmlwcGVkIENTViBGaWxlKiouDQoyLiBXIFIgZ28gcm96cGFrdWouDQozLiBQb2Rjenl0YWogZG9rdW1lbnRhY2rEmSBkbyB0ZWdvIHBsaWt1ICh3IHR5bSBzYW15bSB3aWVyc3p1IGNvIHpiacOzciBkYW55Y2ggbmF6d2E6ICoqRG9jdW1lbnRhdGlvbioqKSANCjQuIFd5YmllcmFteSB6bWllbm5lDQogIC0gY2l0eUUgKGNpdHkgZWxlY3RyaWNpdHkgY29uc3VtcHRpb24gaW4ga3ctaHJzLzEwMCBtaWxlcyksDQogIC0gY2l0eVVGIChFUEEgY2l0eSB1dGlsaXR5IGZhY3RvciAoc2hhcmUgb2YgZWxlY3RyaWNpdHkpIGZvciBQSEVWKSwNCiAgLSBldk1vdG9yIChlbGVjdHJpYyBtb3RvciAoa3ctaHJzKSksDQogIC0gaGlnaHdheUUgKGhpZ2h3YXkgZWxlY3RyaWNpdHkgY29uc3VtcHRpb24gaW4ga3ctaHJzLzEwMCBtaWxlcykuDQo1LiBXeWR6aWVsIHplIHpiaW9ydSBkYW55Y2ggcG9kemJpw7NyIGF1dCB1xbx5d2FqxIVjeWNoIHBhbGl3YSB0eXB1OiBlbGVjdHJpY2l0eSAob3BlcmFjasSFIGZpbHRyb3dhbmlhIHBvIG5pZXplcm93eWNoIG9ic2Vyd2FjamFjaCBkb3R5Y3rEhWN5Y2ggbnAuIGV2TW90b3IpLg0KNi4gV3lrb25haiBuYSBwb2R6YmlvemUgcG9kc3Vtb3dhbmlhIGRvdHljesSFY2Uga2HFvGRlaiB6ZSB6bWllbm55Y2ggbGljemJvd3ljaCAoxZtyZWRuaWEsIHdhcmlhbmFjamEsIG9kY2h5bGVuaWUgc3RhbmRhcmRvd2UgbWluLCBtYXggaXRwKS4NCjcuIERsYSBrYcW8ZGVqIHptaWVubmVqIGxpY3pib3dlaiB3eWtvbnVqIHcgKipnZ3Bsb3QyKiogcnlzdW5raToNCiAgLSBkeXN5dHJ5YnVhbnR5IGVtcGlyeWN6bmVqIHdhcnN0YXdhICoqc3RhdF9lY2RmKiosDQogIC0gd3lrcmVzdSBwdWRlxYJrby13xIVzeSwgaGlzdG9ncmFtdSwgZ8SZc3RvxZtjaS4NCjguIFVzdGFsIHppYXJubyBnZW5lcmF0b3JhIGxpY3piIHBzZXVkb2xvc293eWNoIHBvbGVjZW5pZW0gKipzZXQuc2VlZCgxOTAzMjAyMCkqKg0KOS4gS29yenlzdGFqxIVjIHogZ2VuZXJhdG9yw7NXIGxpY3piIHBzZXVkb2xvc293eWNoIHJvemvFgmFkw7N3IG5vcm1hbG5lZ28gaSBiZXRhICgqKnJub3JtKiogaSAqKnJiZXRhKiopLCBkbGEgZHfDs2NoIHBhciByw7PFvG55Y2ggcGFyYW1ldHLDs1cgZGxhIGthxbxkZWdvIHogbmljaCwgd3lnZW5lcnVqIHBvIDIwMCBsaWN6YiBwc3VlZG9sb3Nvd3ljaC4gTWFzeiBtaWXEhyA0IGNpxIVnaSBsaWN6Yi4NCjEwLiBOYXJ5c3VqIGRsYSBuaWNoIGhpc3RvZ3JhbXkgaSBkeXN0cnlidWFudMSZIGVtaXJ5Y3puxIUuDQoxMS4gUHJ6ZcWbbGkgc2tyeXAgKipSKiogZG8gZG5pYSAyNSBtYXJjYSBici4NCg0KVyByYXppZSBweXRhxYQgcG9yc3rEmSBvIGtvbnRhayBlLW1haWxvd3kuDQoNCiMgUHJhY2EgZG9tb3dhIHogZG5pYSAxOSBtYXJjYSAyMDIwci4gKGRvIGxhYm9yYXRvcml1bSkNCg0KMS4gUHJvc3rEmSB3eWdlbmVyb3dhxIcgcHJ6eSBwb21vY3kgY28gbmFqbW5pZWogOCByw7PFvG55Y2ggZ2VuZXJhdG9yw7N3IGxpY3piIHBzZXVkb2xvc293eWNoIChyw7PFvG5lIHJvemvFgmFkeSBwcmF3ZG9wb2RvYmllxYRzdHdhKSBjacSFZ2kgMjAwIGxpY3piIHBzZXVkb2xvc293eWNoLiBQcm9zesSZIHVzdGF3acSHIHppYXJubyBnZW5lcmF0b3JhIGxpY3pixIUgcHN1ZG9sb3Nvd3ljaCBuYSAqKjE5MDMyMDIwKiouDQoyLiBEbGEgd3lsb3Nvd2FueWNoIGNpxIVnw7N3IHByb3N6xJkgbmFyeXNvd2HEhyBoaXN0b2dyYW15IGkgZHlzdHJ5YnVhbnR5IGVtcGlyeWN6bmUuDQozLiBQcm9zesSZIG5hcnlzb3dhxIcgd3lrcmVzeSBnxJlzdG/Fm2NpIGkgZHlzdHJ5YnVhbnQgY28gbmFqbW5pZWogNiByb3prxYJhZMOzdyBwcmF3ZG9wb2RvYmllxYRzdHdhIHByemVkc3Rhd2lhbnljaCBuYSB3eWvFgmFkemllIChkbGEga2HFvGRlZ28geiA1IHdhcmlhbnRhbWkgcGFyYW1ldHLDs3cpLiA8c3BhbiBzdHlsZT0iY29sb3I6IHJlZCI+IA0KR8SZc3RvxZtjaSAob2Rwb3dpZWRuaW8gZHlzdHJ5YnVhbnR5KSBkbGEgZGFuZWdvIHR5cHUgcm96a8WCYWR1IG1hasSFIGJ5xIcgdW1pZXN6Y3pvbmUgbmEgamVkbnltIHJ5c3Vua3UuPC9zcGFuPg0KNC4gUHJvc3rEmSBuYXJ5c293YcSHIHBvZHN0YXdvd2Ugc3RhdHlzdHlraSBncmFmaWN6bmUgZGxhIHd5YnJhbnljaCBkd8OzY2ggem1pZW5ueWNoIGN6eW5uaWtvd3ljaCBpIGR3w7NjaCBjacSFZ8WCeWNoIChkeXNrcmV0bnljaCB6IGR1xbzEhSBpbG/Fm2NpxIUgb2JzZXJ3YWNqaSkgeiBqZWRuZWdvIHplIHpiaW9ydSBhY3NfbnkuY3N2IGx1YiBhY3NOZXcuY3N2Lg0KPHNwYW4gc3R5bGU9ImNvbG9yOiByZWQiPiBEYW5lIHPEhSBkb3N0xJlwbmUgbmEgc3Ryb25pZSBKYXJlZGEgUC4gTGFuZGVyYSAodyBza3J5cGNpZSB6YmnDs3IgbmFsZcW8eSBwb2JyYcSHLCBvZHBvd2llZG5pbyB6bW9keWZpa293YcSHIGRhbmUgaSBkb3BpZXJvIHd0ZWR5IG1vxbxuYSByeXNvd2HEhykuIDwvc3Bhbj4NCjxzcGFuIHN0eWxlID0gImNvbG9yOiByZWQiPiA8Y2VudGVyPlRlcm1pbiBwcnplc8WCYW5pYSAyIGt3aWV0bmlhIGJyLjwvY2VudGVyPiA8L3NwYW4+DQo1LiBQcm9zesSZIHNpxJkgemFwb3puYcSHIG5hIG5hc3TEmXBuZSBsYWJvcmF0b3JpYSB6ZSBzcG9zb2JhbWkgbGljemVuaWEgcHJ6ZWR6aWHFgsOzdyB1Zm5vxZtjaSBbQmlibGlvdGVrIHJjb21wYW5pb25dKGh0dHBzOi8vcmNvbXBhbmlvbi5vcmcvaGFuZGJvb2svQ18wMy5odG1sKSwgWzkuIENhbGN1bGF0aW5nIENvbmZpZGVuY2UgSW50ZXJ2YWxzXShodHRwczovL3d3dy5jeWNsaXNtby5vcmcvdHV0b3JpYWwvUi9jb25maWRlbmNlLmh0bWwpIGkgW0hvdyB0byBDYWxjdWxhdGUgQ29uZmlkZW5jZSBJbnRlcnZhbCBpbiBSP10oaHR0cHM6Ly9kYXRhc2hhcmtpZS5jb20vaG93LXRvLWNhbGN1bGF0ZS1jb25maWRlbmNlLWludGVydmFsLWluLXIvKS4NCg0KIDxjZW50ZXI+PGgyPjxzcGFuIHN0eWxlID0gImNvbG9yOiByZWQiPlV3YWdhLjwvc3Bhbj48L2gyPjwvY2VudGVyPiA8aDM+TmF6d2EgcGxpa3UgaSB0eXR1xYIgZS1tYWlsYSB6ZSBza3J5cHRlbSB6IGxhYm9yYXRvcml1bSBpIHogcHJhY8SFIGRvbW93xIUgcG93aW5pZW55IGJ5xIcgemdvZG55IHplIG5hc3TEmXB1asSFY3ltIHNjaGVtYXRlbSAqKk51bWVyQWxidW11X05hendpc2tvX1BEeHgqKiBsdWIgKipOdW1lckFsYnVtdV9OYXp3aXNrb19MYWJ4eCoqLCBnZHppZSB4eCBvbmFjemEgbnVtZXIgcHJhY3kgZG9tb3dlaiBsdWIgemFqxJnEhyBsYWJvcmF0b3JpdW0uIFByYWPEmSBkb21vd8SFIGkgc2tyeXB0IHogbGFib3JhdG9yaXVtIHd5c3nFgmFqxIUgUGHFhHN0d28gb2RkemllbG5pZSE8L2gzPi4NCg0K