cum să rulați Scala și Spark în notebook-ul Jupyter

notebook-ul Jupyter este unul dintre cele mai utilizate instrumente în proiectele de știință a datelor. Este un instrument excelent pentru dezvoltarea de software în python și are un suport excelent pentru asta. Acesta poate fi, de asemenea, utilizat pentru dezvoltarea scala cu spylon-kernel. Acesta este un nucleu suplimentar care trebuie instalat separat.

Pasul 1: Instalați pachetul

pip install spylon-kernel

Pasul 2: Creați o spec kernel

acest lucru ne va permite să selectăm nucleul scala din notebook.

python -m spylon_kernel install

Pasul 3: porniți notebook-ul jupyter

ipython notebook

și în notebook selectăm New -> spylon-kernel . Aceasta va începe nucleul nostru scala.

Pasul 4: testarea notebook-ului

să scriem un cod scala:

val x = 2
val y = 3x+y

ieșirea ar trebui să fie ceva similar cu rezultatul din imaginea din stânga. După cum puteți vedea, de asemenea, pornește componentele spark. Pentru aceasta, asigurați-vă că aveți SPARK_HOME configurat.

acum putem folosi chiar spark. Să-l testăm prin crearea unui set de date:

val data = Seq((1,2,3), (4,5,6), (6,7,8), (9,19,10))
val ds = spark.createDataset(data)
ds.show()

aceasta ar trebui să producă un cadru de date simplu:

și putem folosi chiar python în acest kernel folosind comanda %python :

%%python
x=2
print(x)

pentru mai multe informații puteți vizita pagina spylon-kernel github. Notebook-ul cu codul de mai sus este disponibil aici.

Lasă un răspuns

Adresa ta de email nu va fi publicată.