apache-spark tutorials and guides

Spark app unable to write to elasticsearch cluster running in docker

Oct 21, 2022

Jackson version is too old

Oct 20, 2022

scala apache-spark sbt

Updating data in database in Spark using Scala

Oct 20, 2022

scala apache-spark

How to tune "spark.rpc.askTimeout"?

Oct 20, 2022

apache-spark spark-streaming

How to Adjust Classification Threshold with a Spark Decision Tree

Oct 21, 2022

apache-spark apache-spark-mllib decision-tree

Why does spark-submit in YARN cluster mode not find python packages on executors?

Oct 20, 2022

python apache-spark pyspark

Specify hbase-site.xml to spark-submit

Oct 20, 2022

scala apache-spark hbase

Categorize using spark sql

Oct 20, 2022

sql database apache-spark

How to return complex types using spark UDFs

Oct 20, 2022

java json apache-spark user-defined-functions udf

How to set a blob column in the where clause using spark-connector-api?

Oct 20, 2022

java apache-spark cassandra spark-cassandra-connector

Scala: Write log to file with log4j

Oct 20, 2022

scala apache-spark jar log4j

MongoDB Spark Connector - aggregation is slow

Oct 19, 2022

mongodb apache-spark mongodb-query mongodb-java

How to manage conflicting DataProc Guava, Protobuf, and GRPC dependencies

Oct 20, 2022

apache-spark google-cloud-dataproc google-hadoop vitess

How can see the SQL statements that SPARK sends to my database?

Oct 20, 2022

apache-spark pyspark vertica pyspark-sql

Why would one use DataFrame.select over DataFrame.rdd.map (or vice versa)?

Oct 20, 2022

performance apache-spark dataframe apache-spark-sql rdd

spark task size too big

Oct 20, 2022

apache-spark logistic-regression

Can I extract significane values for Logistic Regression coefficients in pyspark

Oct 20, 2022

apache-spark machine-learning pyspark logistic-regression significance

How can I convert a custom Java class to a Spark Dataset

Oct 20, 2022

java apache-spark dataset

Does Apache Spark read and process in the same time, or in first reads entire file in memory and then starts transformations?

Oct 20, 2022

hadoop apache-spark

Get wrong recommendation with ALS.recommendation

Sep 29, 2022

apache-spark machine-learning apache-spark-mllib recommendation-engine collaborative-filtering

New posts in apache-spark